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Der Faktor RecA aus Bacillus licheniformis und recA-inaktivierte Sicherheitsstamme fur 

die biotechnologische Produktion 

Die vorliegende Erfindung betrifft den Faktor RecA aus Bacillus licheniformis DSM 13 
sowie Mikroorganismen als Sicherheitsstamme fur die biotechnologische Produktion, die 
dadurch gekennzeichnet sind, daft sie funktionelle Deletionen in dem zugehorigen Gen 
recA aufweisen. Ferner steht RecA damit fur weitere molekularbiologische Ansatze zur 
Verfugung. 

Die vorliegende Erfindung liegt auf dem Gebiet der Biotechnologie, insbesondere der 
Herstellung von Wertstoffen durch Fermentation von Mikroorganismen, die zur Bildung 
der interessierenden Wertstoffe in der Lage sind. Hierzu zahlen beispielsweise die 
Herstellung niedermolekularer Verbindungen, etwa von Nahrungsmittelerganzungsstoffen 
Oder pharmazeutisch relevanten Verbindungen, oder von Proteinen, furwelche aufgrund 
ihrer Diversitat wiederum ein groftes technisches Einsatzgebiet besteht. Im ersten Fall 
werden die Stoffwechseleigenschaften der betreffenden Mikroorganismen zur Herstellung 
der Wertstoffe ausgenutzt und/oder verandert; im zweiten Fall werden Zellen eingesetzt, 
die die Gene der interessierenden Proteine exprimieren. In beiden Fallen handelt es sich 
zumeist also um gentechnisch veranderte Organismen (GVO). 

Zur Fermentation von Mikroorganismen besteht ein reichhaltiger Stand der Technik, 
insbesondere auch im groBtechnischen Madstab; er reicht von der Optimierung der 
betreffenden Stamme hinsichtlich der Bildungsrate und der Nahrstoffausnutzung Qber die 
technische Gestaltung der Fermenter bis hin zur Gewinnnung der Wertstoffe aus den 
betreffenden Zellen selbst und/oder dem Fermentationsmedium. Hierfur kommen sowohl 
genetische und mikrobiologische als auch verfahrenstechnische und biochemische 
Ansatze zu tragen. Ziel der vorliegenden Erfindung ist es, diesen Prozeft hinsichtlich der 
sicherheitsrelevanten Aspekte der eingesetzten Mikroorganismen zu verbessern, und 
zwar auf der Ebene der genetischen Eigenschaften der betrachteten Stamme. 
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Dies steht vor dem Hintergrund, daft die Verwendung gentechnisch veranderter 
Organismen im allgemeinen strengen gesetzlichen Richtlinien bezuglich der biologischen 
Sicherheit unterliegt. In den meisten Landern sind die Betreiber von Anlagen mit GVO 
gehalten, dafur zu sorgen, dafl nach Moglichkeit keine GVO in die Umgebung gelangen. 
Zusatzlich sollen fur die Produktion verwendete GVO Eigenschaften aufweisen, die es 
ihnen - falls sie doch in die Umgebung gelangen soliten - erschweren oder je nach 
Gefahrenpotential sogar unmoglich machen sollen, sich dort zu vermehren 
(„Containment"~Konzept). 

Dem Obersichtsartikel „Suicidal genetic elements and their use in bological containment of 
bacteria" von S.Molin et al. (Annu. Rev. Microbiol., 1993, Band 47, Seiten 139 bis166) 
zufolge wird dabei zwischen den beiden grundsatzlichen Strategien differenziert, als 
„aktive" Komponenten, kontrollierte Suizidsysteme in die Zellen einzufuhren oder uber 
„passive" Systeme die Zelleigenschaften so zu verandern, dali ihre Oberlebenschancen 
unter StreBbedingungen sinken. Die zweite, fur die vorliegende Anmeldung relevante 
Strategie wird darin auch als disablement approach" bezeichnet. 

Stamme von GVO mit einem verminderten Risiko fur Mensch und Umwelt im Falle einer 
unbeabsichtigten Freisetzung werden als Sicherheitsstamme bezeichnet. Je nach den 
grundsatzlichen Eigenschaften der Mikroorganismen werden zunehmend mehrere 
Eigenschaften gefordert, von denen jede fur sich einen Sicherheitsaspekt darstellt. Somit 
ist es vorteilhaft, verschiedene Instrumente zur Erzeugung von Sicherheitsstammen zur 
Verfugung zu haben. Hiervon sind einige „passive" Systeme bereits im Stand der Technik 
beschrieben. 

So betrifft die Anmeldung EP 369817 A1 Bacillus-Stamme, insbesondere B. subtilis, zur 
Herstellung und Sekretion von Proteinen, bei denen die Gene fur extra- und intrazellulare 
Proteasen, namlich epr, rp-l, rp-ll, isp-1, apr und/oder npr durch Punktmutationen oder 
Insertionen inaktiver Genkopien funktionell inaktiviert worden sind. Der Sinn dieser 
gentechnischen Veranderungen besteht darin, die fur die mit diesen Stammen 
hergestellten, interessierenden Proteine schadlichen Protease-Aktivitaten zu minimieren. 
Die betreffenden Stamme konnen zusatzlich uber Mutationen verfugen, die die 
Sporulation und damit eine Bildung ebenso schadlicher Sporuiationsproteasen 
verhindern. Hierunter wird das in Phase Null der Sporulation (siehe unten) von B. subtilis 
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aktive Gen spoOA genannt, um durch dessen Inaktivierung die mit der Sporulation 
verbundene Bildung intrazellularer Proteasen zu verhindern. 

Die Anmeldung WO 92/16642 A1 verfolgt den gleichen Losungsansatz: sie offenbart, daft 
durch Inaktivierung der Proteasegene apr, npr, isp-1, epr, bpr, rsp und mpr von Bacillus 
ein GroBteil der extrazellularen Protease-Aktivitat ausgeschaltet wird, und lehrt, daft dies 
durch die Inaktivierung des neu beschriebenen Gens vpr fur die Rest-Protease III noch 
verbessert werden kann. Auch hier wird auf die Moglichkeit der Inaktivierung von spoOA 
hingewiesen, um die Bildung intrazellularer Proteasen zu verhindern. 

Bei der Sporulation von grampositiven Bakterien handelt es sich um einen Entwicklungs- 
prozeft zur Bildung von Dauerformen, den sogenannten Sporen, zum Oberdauern widri- 
ger Umwelteinflusse. Sie wird uber eine komplexe.ReguIationskaskade mit vermutlich 
mehr als 100 Genen und unter Beteiligung von speziellen Sigma-Faktoren gesteuert Den 
Zusammenhang dieses Prbzesses mit dem Zellzyklus von B. subtilis beschreibt beispiels- 
weise die Publikation „Cell cycle and sporulation in Bacillus subtilis" (1998) von P.A.Levin 
und A.D.Grossmann in Curr. Opin. Microbiol., Band 1, Seiten 630 bis 635. Hier wird vor 
allem der Transkriptionsfaktor SpoOA als Kontrollelement zum Einleiten der Sporulation 
dargestellt. Die sequentielle Aktivierung der phasenspezifischen Gene durch verschie- 
dene Sigmafaktoren faftt beispielsweise der Obersichtsartikel „Control of sigma factor 
activity during Bacillus subtilis sporulation" (1999) von L.Kroos et al. in Mol. Microbiol., 
Band 31, Seiten 1285 bis 1294 zusammen. Bei diesem Vorgang werden ihrer Reihenfolge 
nach die aufeinanderfolgenden Stadien Null und dann I bis VII beobachtet. Diese 
Numerierung findet sich auch in den Bezeichnungen der beteiligten Gene und Faktoren 
wieder. 

Die Anmeldung EP 492274 A2 offenbart, daft im Stand der Technik bereits uber 
unspezifische Mutagenese die Inaktivierung von Sporulationsgenen gelungen sei, 
wodurch asporogene Mutanten (spo-Minus-Phanotyp) erhalten worden seien. 
EP 492274 A2 selbst beschreibt einen durch gezielte Mutagenese in dem fruhen 
Sporulationsgen spoll:D behandelten B. subtilis-Stamm, der mit einer Reversionsrate von 
weniger als 1 0" 8 praktisch nicht mehr in der Lage ist, Sporen zu bilden. Diese Anmeldung 
lehrt, diesen Stamm erst nach Inaktivierung der weiteren Gene leu (fur die Leucin- 
Synthese), pyrD1 (fur die Uracil-Synthese), apr und npr fur die Herstellung von 
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Wertstoffen fur die biotechnologische Produktion zu verwenden, weil hiermit Vorteile in 
der Produktion sowie Sicherheitsaspekte verbunden seien. 

Die Anmeldung WO 97/03185 A1 befaSt sich ebenfalls mit der Inaktivierung der 
Sporulationsfahigkeit von Bacillus-Spezies mit Ausnahme von B. subtilis und Verwendung 
dieser Stamme zur biotechnologischen Herstellung von Wertstoffen. Dieser Anmeldung 
zufolge soli das frQhe, fur den Sigmafaktor- F codierende Gen spollAC funktionell inakti- 
vlert werden, vorteilhafterweise in Kombination mit Deletionen in Genen der ebenfalls fruh 
aktivierten Sporulationsgengruppen spo2, spo3. HierfQr wird eine irreversible Inaktivierung 
der betreffenden chromosomalen Abschnitte fur spollAC beschrieben. 

Die Anmeldung WO 02/097064 A1 (EP 1391502 A1) betrifft Mikroorganismen, bei denen 
Gene aus den Stadien II, III, IV oder V der Sporulation deletiert oder inaktiviert worden 
sind. Hierbei handelt es sich urn die Gene sigE, sigF, spollE, spollSB und sigG von 
B. subtilis, die innerhalb des Geriorts von spolVCB bis spolllC von B. subtilis liegen. 
Dieser kann anhand der Datenbank SubtiList (zugSnglich uber 
http://genolist.pasteur.fr/SubtiList/genome.cgi) auf den Bereich der Positionen von ca. 
2.642.000 kb bis ca. 2.700.000 kb des inzwischen bekannten Gesamtgenoms von 
B. subtilis eingegrenzt werden. Dieser Anmeldung hatte die Aufgabe zugrunde gelegen, 
uberflQssige oder schadliche Aktivitaten von Bacillus-Stammen auszuschalten, urn die 
biotechnologische Produktion zu verbessern. Durch die genannten Modifikationen der 
mittleren bis spaten Sporulationsgene wurde bei Einsatz der betreffenden Stamme fur die 
biotechnologische Produktion die Sporenbildung unterdruckt; dies wirke sich vorteilhaft 
auf die Nahrstoff- und Energieverwertung aus; gleichzeitig konne die Dauer der 
Fermentation erhoht werden, urn daruber die Gesamtausbeute an interessierendem 
Wertstoff zu erhohen. 

Der Obergang grampositiver Bakterien in die Dauerform der Spore wird also durch 
ungunstige Umweltbedingungen ausgelost. Genau dies dQrfte auch dann geschehen, 
wenn Bakterien aus den optimalen Wachstumsbedingungen der Fermentation 
unbeabsichtigt aus der Anlage austreten und in die Umgebung gelangen sollten. 
Demgegenuber ist, wie soeben dargelegt, uber die Unterbindung der Fahigkeit zur 
Sporulation zur Erzeugung sicherer GVO bislang erst wenig nachgedacht worden. Der 
einschlagige Stand der Technik scheint lediglich nahezulegen, daB die Sporulation 
grampositiver Bakterien (a) wegen der damit verbundenen Proteaseaktivitaten und/oder 
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(b) zur Verlangerung der Fermentationsdauer fruhzeitig und vollstandig unterbunden 
werden sollte, urn letztlich die Fermentationsausbeute der so erhaltenen asporogenen 
Stamme zu steigern. Zur Verfolgung von Sicherheitsaspekten werden dagegen nur 
mehrere, zusatzlich einzufuhrende Mutationen offenbart. 

Das fur den in Prokaryonten beschriebenen Faktor RecA codierende Gen recA ist in der 
Molekularbiologie sehr bekannt, bislang insbesondere jedoch aus einem anderen 
Zusammenhang als dem der Herstellung von Sicherheitsstammen. Dieser Faktor bindet 
spezifisch und kooperativ an einzelstrangige DNA und sorgt unter ATP-Hydrolyse fur eine 
teiiweise Entwindung doppelstrangiger DNA. Dieser Vorgang ermoglicht den genetischen 
Vorgang der Rekombination, das heifit den Strangaustausch zwischen ahnlichen DNA- 
Molekulen. So ist es in der Molekularbiologie ein ubliches Vorgehen, das recA-Gen, 
dadurch zu verwenden, dali es uber ein entsprechendes genetisches Konstrukt mit einer 
defekten recA-Kopie inaktiviert und somit ein recA-Minus-Phanotyp erzeugt wird, welcher 
nicht mehr zur Rekombination in der Lage ist. Beispielsweise nach dem Patent 
US 4713337 werden durch Crossing-over erzeugte Deletionsmutanten durch 
anschliefcende Inaktivierung von recA genetisch stabilisiert. 

Eine biochemische Beschreibung des RecA aus Escherichia coli liefert beispielsweise die 
Publikation „C-terminal deletions of the Escherichia coli RecA" von S.LLusetti et al. (2003; 
J. Biol. Chem., Band 278, Heft 18, Seiten 16372-16380). Daraus geht hervor, dalS 
insbesondere der C-Terminus dieses Molekuls die Einzelstrangbindung vermittelt und 
entsprechende Deletionsmutanten in diesem Bereich neben anderen biochemischen 
Eigenschaften eine erhohte Mitomycin-Sensitivitat aufweisen. Mitomycin ist dafur bekannt, 
dafc es die DNA-Synthese beeintrachtigt und dadurch bakterizid wirkt. Der N-terminale 
Bereich ist dagegen starker an der Bindung von DNA-Doppelstrangen beteiligt. 

Der bereits zitierte Obersichtsartikel von S.Molin et al. verweist ebenfalls auf Arbeiten, bei 
denen eine recA-Minus-Mutation als Markergen fur den gramnegativen Escherichia coli 
verwendet wird. Es wird die Vermutung geauGert, diese Mutation allein konne schon 
ausreichen, urn jegliches Umweltrisiko durch diesen Stamm auszuschlieSen. Andererseits 
werden zwei Nachteile dieses Ansatzes diskutiert, namlich zum einen sei es technisch 
schwierig, diese Mutanten herzustellen und zum anderen wurden die betreffenden 
Stamme auch in ihrem erwunschten Einsatz („short-term competitive properties") derart 
behindert sein, daB man andere die Lebensfahigkeit beschrankende und im betreffenden 
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Artikel erwahnte Mutationen vorziehen wurde. Auch in Kombination mit dem grundsatzlich 
anderen Ansatz zur Erzeugung von Sicherheitsstammen, namlich dem Einfuhren von 
Suizidsystemen, habe sich die Inaktivierung von RecA als nachteilhaft herausgestellt. 

Die Publikation „Freisetzung gentechnisch veranderter Bakterien" von Selbitschka et al. 
(2003; Biologie in unsererZeit, Band 33, Heft 3, Seiten 162-175) beschreibt die 
Freisetzung von gramnegativen, mit einem Luciferase-Gen modifizierten Bakterien der 
Spezies Sinorhizobium meliloti in einem mehrjahrigen Freilandversuch. Sie trugen 
zusatzlich eine Inaktivierung des recA-Gens, welche dazu gefuhrt hat, daG Zellen dieser 
Klone unter naturlichen Bedingungen letztlich nicht Qberleben konnten. 

K.-D. Wittchen hat im Zuge seiner bei der Westfalischen Wilhelms-Universitat Monster 
eingereichten Dissertation (1995) mit dem Titel „Entwicklung eines Sicherheitsstammes 
von Bacillus megaterium DSM 319 und molekulargenetische Charakterisierung des Gens 
fur die extrazellulare neutrale Metalloprotease (nprM)" einen Stamm des grampositiven 
B. megaterium erzeugt, der nach gezielter Gendisruption Deletionen in der im Titel 
genannten neutralen Metalloprotease, der der Isopropylmalat-Dehydrogenase, und eines 
nicht naher bezeichneten SpolV-Proteins enthalt. AnschlielSend wurde an diesem Stamm 
eine recA-Mutation vorgenommen, welche in bezug auf die UV-Sensitivitat des Stammes 
im Vergleich zum Wildtyp allerdings keine wesentlichen Unterschiede verursachte, wohl 
aber bei Wachstum auf Mitomycin C-haltigen Agarplatten. Diese Vierfachmutante wurde 
als Sicherheitsstamm vorgeschlagen, ohne jedoch dessen Realisierbarkeit oder sogar die 
konkreten Auswirkungen dieser Modifikationen auf einen Produktionsprozeli mit 
entsprechend modifizierten Bakterienstammen zu untersuchen. 

Die in derselben Arbeitsgruppe angefertigte Diplomarbeit von H. Nahrstedt (2000) mit 
dem Titel ..Molekulargenetische Charakterisierung des recA-Gens von Bacillus 
megaterium DSM 319 und Konstruktion einer Deletionsmutante" schlagt folgende, 
nebeneinander vorliegende vier Mutationen in zum Teil Gruppen von Genen vor: recA- 
Minus, Protease-Minus. Leucin-Auxotrophie und Sporulations-Defizienz. Es wird 
diskutiert, eine recA-Defizienz als eine Sicherheitsmarke neben anderen in 
Produktionsstamme einzufuhren, weil sich dadurch zum einen unerwunschte 
Rekombinationsprozesse unterdrQcken lielien und zum anderen die betreffenden 
Mutanten eine erhohte Sensitivitat gegenQber DNA-schadigenden Agenzien aufweisen, 
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das heiRt in der Umwelt eine geringere Oberiebenschance besitzen sollten. Auch dieser 
Vorschlag wurde nicht weiterverfolgt. 

Den Stand der Technik zu RecA kann man dahingehend zusammenfassen, dafc dieses 
Protein bisher uberwiegend aus genetischen Zusammenhangen bekannt ist. Der Einsatz 
dieses Faktors bzw. die Inaktivierung des betreffenden Gens zur Erzeugung von Sicher- 
heitsstammen von GVO wird aufgrund seiner physiologischen Bedeutung bisiang eher 
abgelehnt. Erfolgreiche beschreibene Beispiele hierfur sind iediglich recA-Minus-Mutanten 
der gramnegativen Spezies Sinorhizobium meliloti und des grampositiven Bacillus 
megaterium, letztere jeweils nur in Kombination mit drei weiteren sicherheitsrelevanten 
Mutationen. 

Insgesamt bleibt festzuhalten, dafi zur Herstellung von Sicherheitsstammen fur die 
biotechnologische Produktion verschiedene alternative genetische Systeme nach einern 
„passiven" Wirkmechanismus etabliert sind, wie die Inaktivierung von Proteasegenen, die 
Ausschaltung von verschiedenen Stoffwechselgenen zur Erzeugung von Aminosaure- 
Oder Nukleobasenauxotrophien. Bei sporenbildenden grampositiven Bakterien ist die 
Unterbindung der Sporulation beschrieben, insbesondere zu einem fruhen Zeitpunkt, vor 
allem aber urn zusatzliche Vorteile in der Fermentation zu erzielen. 

Es stellte sich somit die Aufgabe, ein weiteres geeignetes Sicherheitssystem fur 
gentechnisch veranderte grampositive Bakterien zu entwickeln, wofur als Grundlage 
zunachst ein geeigneter Faktor und/oder ein geeignetes Gen zu identifizieren waren. 

Einen Teilaspekt dieser Aufgabe stellte nach Feststellung der grundsatzlichen Eignung 
eines solchen Systems die Isolierung eines hierfur verwendbaren genetischen Elements, 
eventuell eines Gens, und der Aminosauresequenz eines hiervon gegebenenfalls 
codierten Faktors dar, urn dieses System entsprechenden molekularbiologischen 
Konstruktionen fur den Einsatz in Produktionsstammen zuganglich zu machen, insbe- 
sondere in Kombination mit einem oder mehreren weiteren der Sicherheit dienenden 
Regulationsmechanismen. 

Ein weiterer Teilaspekt der Aufgabe bestand darin, daB dieses System mit anderen 
Sicherheitssystemen kombinierbar sein sollte. 
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Somit lag eine Teilaufgabe darin, ein weiteres derartiges, hiermitzu kombinierendes 
Sicherheitssystem zu definieren, vorzugsweise eines, das neben diesen beiden Systemen 
keine weiteren Mutationen erforderlich machen wurde. Mit anderen Worten: maximal 
diese zwei Mutationen sollten ausreichen, urn einen grampositiven Sicherheitsstamm zu 
erzeugen, der weitgehende Anforderungen an die Verminderung der Lebensfahigkeit in 
der Umwelt erfullen, das heiftt zu einer minimalen Reversionsrate fuhren sollte. Denn eine 
niedrigere Zahl als vier nebeneinander wirksame Systeme bedeutet einen zunehmend 
geringeren Arbeitsaufwand zur Herstellung dieser Stamme. 

Ein Nebenaspekt dieser Aufgabe bestand darin, ein derartiges Sicherheitssystem zu 
finden, das nicht so speziell ist, dalS es nicht auch in anderen molekularbiologischen 
Ansatzen Verwendung finden konnte. 

Diese Aufgabe wird durch den Faktor RecA mit einer Aminosauresequenz, die zu der in 
SEQ ID NO. 2 angegebenen Aminosauresequenz mindestens zu 96% identisch ist, 
beziehungsweise durch die fur einen Faktor RecA codierende Nukleinsaure, deren 
Nukleotidsequenz zu der in SEQ ID NO. 1 angegebenen Nukleotidsequenz mindestens 
zu 85% identisch ist, gelost. 

Die in SEQ ID NO. 2 und 1 angegebenen Aminosaure- und Nukleotidsequenzen sind die 
fur RecA. Dabei codieren alle Positionen von 1 bis 1047 fur das Protein; die letzten drei 
stellen dabei das Stop-Codon dar. Sie werden als Gen und Protein recA beziehungsweise 
RecA bezeichnet. Sie stammen aus dem bei der Deutschen Sammlung von 
Mikroorganismen und Zellkulturen GmbH, Mascheroder Weg 1b, 38124 Braunschweig 
(http://www.dsmz.de) unter der Nummer DSM 13 hinterlegten Stamm Bacillus 
licheniformis. ErfindungsgemaUe Losungen der Aufgabe stellen alle Faktoren 
beziehungsweise Nukleinsauren dar, die hierzu eine hinreichend Homologie aufweisen, 
wie sie mit den jeweiligen Prozentangaben definiert ist. 

Als nachster Stand der Technik kann der entsprechende Faktor aus B. amyloliquefaciens 
angesehen werden. Die zugehorigen DNA- und Aminosauresequenzen sind in der 
Datenbank NCBI der National Institutes of Health der USA (http://www.ncbi.nlm.nih.gov) 
unter der Zugangsnummer AJ515542 veroffentlicht. RecA aus B. licheniformis DSM 13 
weist hierzu auf Aminosaureebene eine Homologie von 94,0% Identitat und auf 
Nukleinsaureebene eine Ubereinstimmung von 81,2% Identitat auf. Beide Vergleiche 
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gehen aus den Alignments der Figuren 1 und 2 hervor, wo die Sequenzen von 
B. amyloliquefaciens jeweils in der zweiten Zeile dargestellt sind. 

Als nachstahnliche Enzyme wurden RecA aus B. subtilis und RecE aus B. subtilis mit 
jeweils 93,4% Identitat ermittelt. Sie weisen auf DNA-Ebene Homologiewerte von 81,0% 
beziehungsweise 81,2% Identitat auf, Sie sind ebenfalls in der NCBI-Datenbank, und zwar 
unterden Eintragungsnummern Z99112 (Region 161035 bis 162078) beziehungsweise 
X52132 veroffentlicht. Die Aminosaure- und DNA-Vergleiche mit diesen Faktoren sind 
ebenfalls in den Figuren 1 und 2 Qeweils Zeilen 3 beziehungsweise 4) dargestellt. 

Diese hohen, beanspruchten Homologiewerte urn den konkret hier beschriebenen Faktor 
lassen erwarten, dali derselbe Faktor RecA besonders in verwandten Stammen Oder 
Spezies, wahrscheinlich aber auch in weniger verwandten Spezies, wahrscheinlich sogar 
gramnegativen Organismen die zugehorige Funktion ubernimmt. Diese liegt 
erfindungsgemaU in der eingangs erlauterten DNA-Einzelstrangbindung und der damit 
verbundenen Rolle fur Rekombinationsvorgange von Nukleinsauren. Vergleichbare 
Wirkungen sollten auch mit Deletionen des recA-Gens verbunden sein, namlich die 
Unterbindung von DNA-Rekombinationen und eine dadurch verminderte Lebensfahigkeit. 
Gleichzeitig sollte ein recA-Gen aus dem einen Stamm geeignet sein, diese Funktion in 
einem anderen zu ubernehmen; dies wird mit zunehmender Ahnlichkeit zunehmend 
besser gelingen. Hierdurch wird der Einsatz des betreffenden Gens fur die Herstellung 
von Deletionsmutanten der verschiedensten grampositiven Mikroorganismen moglich. 

Dadurch wird fur RecA und vor allem fur das zugehorige Gen recA ein weites technolo- 
gisches und kommerziell relevantes Gebiet eroffnet, namlich die Herstellung von Wert- 
stoffen durch Fermentation von genetisch veranderten grampositiven Bakterien. Sie 
konnen uber Mutationen in recA nicht nur hinsichtlich ihrer genetischen Stabilitat sondern 
auch ihrer Sicherheit verbessert werden. Dies gilt, wie unten weiter ausgefuhrt, insbe- 
sondere fur Stamme, die in der biotechnologischen Produktion tatsachlich eingesetzt 
werden, wie beispielsweise Bacillus licheniformis. 

Wie unten ebenfalls detaillierter ausgefuhrt geschieht dies vorzugsweise im Zusammen- 
hang mit einer und besonders bevorzugt keinen weiteren sicherheitsrelevanten 
Deletionen. Ebenso bevorzugt geschieht dies in moglichst nahe verwandten Stammen. 
Hierbei ist jedoch von B. megaterium abzusehen, zum einen weil hierfCir, wie einleitend 
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beschrieben, bereits die Spezies-eigenen recA-Gene beziehungsweise die hierin 
deletierten Mutanten zur Verfugung stehen und zum anderen weil diese Spezies, die sich 
insbesondere durch ihre grofcen Zellen und damit verbundene mikrobiologische 
Eigenheiten auszeichnet, im allgemeinen nicht fur die groBtechnische Fermentation 
genutzt wird. 

Gegenstande der vorliegenden Erfindung liegen somit in dem Faktor RecA (SEQ ID 
NO. 2) und dem zugehSrigen Gen recA (SEQ ID NO. 1) aus B. licheniformis DSM 13 
beziehungsweise nahen Verwandten hierzu. Ebenso stellt die Verwendung eines recA- 
Gens zu dessen funktioneller Inaktivierung in einem grampositiven Bakterium einen 
Erfindungsgegenstand dar, vorzugsweise in Kombination mit der funktionellen 
Inaktivierung eines in der Phase IV der Sporulation grampositiver Mikroorganismen 
aktiven Gens, vorzugsweise spolV, yqfD beziehungsweise Homologen hierzu. Dies 
geschieht vorteilhafterweise mithilfe der in der vorliegenden Anmeldung zusatzlich 
beschriebenen Gene spolV und yqfD. Einen entsprechenden Gegenstand der 
vorliegenden Erfindung stellen die hierdurch erhaltenen grampositiven Mikroorganismen 
dar; ebenso die mit diesen Organismen durchgefuhrten Fermentationen, insbesondere 
zur Herstellung von Wertstoffen. Des weiteren steht mit der vorliegenden Anmeldung ein 
RecA-Protein zur Verfugung, das in molekularbiologischen Ansatzen oder zur Modulation 
der molekularbiologischen Aktivitaten von Zellen verwendet werden kann, insbesondere 
im Zusammenhang mit DNA-Polymerisations- oder Rekombinationsvorgangen. 

Zum ersten Erfindungsgegenstand gehort jeder oben definierte Faktor RecA mit einer 
Aminosauresequenz, die zu der in SEQ ID NO. 2 angegebenen Aminosauresequenz 
zunehmend bevorzugt mindestens zu 96,5%, 97%, 97,5%, 98%, 98,5%, 99%, 99,5% und 
ganz besonders bevorzugt zu 100% identisch ist. 

Denn wie erlautert ist mit zunehmender Ahnlichkeit eine zunehmende Obereinstimmung 
der Funktionen und damit eine Austauschbarkeit der Faktoren zu erwarten. 

Vorzugsweise handelt es sich dabei urn einen Faktor RecA, der von einer Nukleinsaure 
codiert ist, deren Nukleotidsequenz zu der in SEQ ID NO. 1 angegebenen 
Nukleotidsequenz mindestens zu 85% identisch ist. 
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In bevorzugten Ausfuhrungsformen sind das Faktoren, die von einer Nukleinsaure codiert 
sind, deren Nukleotidsequenz zu der in SEQ ID NO. 1 angegebenen Nukleotidsequenz 
zunehmend bevorzugt mindestens zu 87,5%, 90%, 92,5%, 95%, 96%, 97%, 98%, 99% 
und ganz besonders bevorzugt zu 1 00% identisch ist. 

Denn fiber die Nukleinsauren stehen die betreffenden Faktoren beziehungsweise Gene 
fur die Transformation in andere, vorzugsweise verwandte Spezies oder fur 
Modifikationen zur Verfugung. Hierzu gehoren, wie unten detaillierter erlautert, 
insbesondere Mutationen der betreffenden Gene. Mit einem zunehmenden Mali an 
Identitat zur angegebenen Sequenz sollte der Erfolg bei solchen Spezies umso grofter 
sein, die zu B. licheniformis zunehmend verwandt sind, insbesondere bei der fur die 
biotechnologische Produktion besonders wichtigen Spezies B. licheniformis selbst 

Wie erlautert dienen der Verwirklichung der vorliegenden Erfindung vor aliem die fur einen 
Faktor RecA codierenden Nukleinsauren, deren Nukleotidsequenz zu der in SEQ ID 
NO. 1 angegebenen Nukleotidsequenz mindestens zu 85% identisch ist 

Dies gilt urn so mehr fur derartige Nukleinsauren, deren Nukleotidsequenz zu der in SEQ 
ID NO. 1 angegebenen Nukleotidsequenz zunehmend bevorzugt mindestens zu 87,5%, 
90%, 92,5%, 95%, 96%, 97%, 98%, 99% und ganz besonders bevorzugt zu 100% 
identisch ist. Denn diese konnen uber entsprechende Konstruktionen zur Transformation 
und/oder zur Mutagenese verwendet werden, wobei eine zunehmende Ahnlichkeit den 
erwunschten Erfolg umso wahrscheinlicher werden laBt. 

Ganz besonders bevorzugt handelt es sich dabei urn eine derartige Nukleinsaure, die fur 
einen zuvor beschriebenen Faktor RecA codiert. Dies gilt beispielsweise fur Strategien, 
bei denen ein funktioneller Faktor RecA hergestellt werden soil, etwa fur die unten 
ausgefuhrten molekularbiologischen Versuchsansatze, oder fur die Erzielung einer 
maximalen Obereinstimmung mit dem jeweils endogenen tatsachlich fur RecA 
codierenden Gen, welches modifiziert und/oder ausgeschaltet werden soli. Denn in vielen 
Fallen reicht eine Mutation in einer einzigen Position, urn etwa uber eine nonsense- 
Mutation das Gen beziehungsweise den Faktor in seiner naturlichen Funktion 
auszuschalten. 
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Einen eigenen Erfindungsgegenstand stellt die Verwendung einer fur einen Faktor RecA 
codierenden Nukleinsaure zur funktionellen Inaktivierung des Gens recA in einem 
grampositiven Bakterium dar, welches nicht Bacillus megaterium ist. 

Denn zum einen gibt es fur B. megaterium bereits die einleitend erwahnten Studien, in 
denen vorgeschlagen wird, gleichzeitig mit mehreren anderen Mutationen auch recA zu 
deletieren, urn zu Sicherheitsstammen zu gelangen. Zum zweiten stellen andere 
grampositive Bakterien wie beispielsweise solche der Gattungen Bacillus, 
Staphylococcus, Corynebakterium und Clostridium im Stand der Technik wichtigere 
Wirtsorganismen fur die biotechnologische Produktion von Wertstoffen (siehe unten) dar. 

Unter der funktionellen Inaktivierung ist im Sinne der vorliegenden Anmeldung jede Art 
von Modification oder Mutation zu verstehen, wonach die Funktion eines RecA als 
Einzelstrang-DNA-bindenden Faktors unterbunden wird. Dazu gehort die Ausfuhrungs- 
form, daft ein praktisch vollstandiges, aber inaktives Protein gebildet wird, daft inaktive 
Teile eines RecA in der Zelle vorliegen, bis hin zu den Moglichkeiten, daft das Gen recA 
nicht mehr translatiert wird oder sogar vollstandig deletiert ist. Somit besteht die eingangs 
diskutierte ..Verwendung" dieses Faktors oder dieses Gens dieser Ausfuhrungsform nach 
darin, daft er beziehungsweise es von der betreffenden Zelle eben nicht mehr auf seine 
naturliche Weise zur Wirkung kommt. Dies wird diesem Erfindungsgegenstand zufolge auf 
genetischer Ebene dadurch erreicht, daft das betreffende Gen ausgeschaltet wird. 

Nach einer Ausfuhrungsform dieser Verwendung wird eine fur ein nichtaktives Protein 
codierende Nukleinsaure mit einer Punktmutation eingesetzt. 

Derartige Nukleinsauren konnen uber an sich bekannte Verfahren zur Punktmutagenese 
erzeugt werden. Solche sind beispielsweise in einschlagigen Handbuchern wie dem von 
Fritsch, Sambrook und Maniatis, ..Molecular cloning: a laboratory manual", Cold Spring 
Harbour Laboratory Press, New York, 1989, dargestellt. Zudem stehen hierfur inzwischen 
zahlreiche kommerzielle Baukasten zur Verfugung, etwa das QuickChange®-Kit der Firma 
Stratagene, La Jolla, USA. Das Prinzip besteht darin, daft Oligonukleotide mit einzelnen 
Austauschen (Mismatch-Primer) synthetisiert und mit dem einzelstrangig vorgelegten Gen 
hybridisiert werden; anschlieftende DNA-Polymerisation ergibt dann entsprechende 
Punktmutanten. Hierfur k6nnen die jeweiligen Spezies-eigenen recA-Sequenzen 
verwendet werden. Aufgrund der hohen Homologien ist es moglich und erfindungsgemaft 
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besonders vorteilhaft, diese Reaktion anhand der mit SEQ ID NO. 1 zur Verfugung 
gestellten Sequenz oder etwa den anderen aus Figur 2 hervorgehenden Sequenzen 
verwandter Spezies durchzufuhren. Diese Sequenzen konnen auch dazu dienen, 
entsprechende Mismatch-Primer fur verwandte Spezies zu entwerfen, insbesondere 
anhand der im Alignment der Figur 2 identifizierbaren konservierten Bereiche. 

Nach einer Ausfuhrungsform dieser Verwendung wird eine Nukleinsaure mit einer 
Deletions- oder Insertionsmutation eingesetzt, vorzugsweise umfassend die jeweils 
mindestens 70 bis 150 Nukleinsaurepositionen umfassenden Randsequenzen des fur das 
Protein codierenden Bereichs. 

Auch diese Verfahren sind dem Fachmann an sich vertraut. Somit ist es moglich, die 
Bildung eines Faktors RecA durch die Wirtszelle dadurch zu verhindern, dali ein Teil des 
Gens auf einem entsprechenden Transformationsvektor uber Restriktionsendonukleasen 
herausgeschnitten und der Vektor anschlielSend in den interessierenden Wirt transformiert 
wird, wo uber die - bis dahin noch mogliche - homologe Rekombination das aktive Gen 
gegen die inaktive Kopie ausgetauscht wird. In der Ausfuhrungsform der Insertions- 
mutation kann lediglich das intakte Gen unterbrechend oder anstelle eines recA-Genteils 
ein anderes Gen, beispielsweise ein Selektionsmarker eingefugt werden. Hieruber ist das 
Mutationsereignis in an sich bekannter Weise phanotypisch uberprufbar. 

Um diese jeweils notwendigen Rekombinationsereignisse zwischen dem in die Zelle 
eingefuhrten defekten Gen und der beispielsweise auf dem Chromosom endogen 
vorhandenen intakten Genkopie zu ermoglichen, ist nach dem derzeitigen Wissensstand 
eine Obereinstimmung in jeweils mindestens 70 bis 150 zusammenhangenden 
Nukleinsaurepositionen, jeweils in den beiden Randsequenzen zu dem nichtuberein- 
stimmenden Teil notig, wobei es auf den dazwischenliegenden Teil nicht ankommt. 
Dementsprechend sind solche Ausfuhrungsformen bevorzugt, die lediglich zwei 
flankierende Regionen mit mindestens diesen Groften umfassen. 

Nach einer alternativen Ausfuhrungsform dieser Verwendung werden Nukleinsauren mit 
insgesamt zwei Nukleinsaureabschnitten eingesetzt, die jeweils mindestens 70 bis 150 
Nukleinsaurepositionen umfassen und damit den fur das Protein codierenden Bereich 
zumindest teilweise, vorzugsweise vollstandig flankieren. 
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Denn allein urn den Austausch der beiden Genkopien uber homologe Rekombination zu 
ermoglichen, braucht es sich dabei nicht zwangslaufig um proteincodierende Abschnitte 
zu handeln. Vielmehr eignen sich hierfur auch die Randbereiche der betreffenden Gene, 
welche naturlicherweise eine andere Funktion (Promoter, Terminator, Enhancer etc.) 
ausuben Oder lediglich nichtfunktionelle intergenische Abschnitte darstellen. So kann die 
funktionelle Inaktivierung beispielsweise auch in der Deletion des Promoters bestehen, 
wofur es bei einer Deletionsmutation dieser Ausfuhrungsform notwendig ist, auf 
flankierende, nichtcodierende Abschnitte zuruckzugreifen. Je nach Einzelfall kann es auch 
sinnvoll sein, fur die flankierenden Regionen solche Abschnitte auszuwahlen, die zum Teil 
in den proteincodierenden Bereich hineinreichen und zum Teii au&erhalb liegen. 

Derartige, wenigstens zum Teil nichtcodierende Bereiche konnen fur die Gene recA aus 
B. amyloiiquefaciens und fur recA und recE aus B. subtilis den oben angegebenen 
Datenbankeintragen entnommen werden. Fur andere Stamme, beispielsweise auch fur 
recA aus B. licheniformis ist es moglich; die betreffenden nichtcodierenden Bereiche uber 
PCR-basierte Verfahren aus einer Preparation der genomischen DNA zu erschlieften. 
Diese Verfahren (beispielsweise anchored PGR) sind im Stand der Technik etabliert. Ais 
Ausgangspunkte hierfur dienen die bekannten Genabschnitte. Der vorliegenden Erfindung 
zufolge konnen die hierfur benotigten Primer anhand der SEQ ID NO. 1 auch fur andere 
Spezies grampositiver Bakterien und hierunter insbesondere fur solche der Gattung 
Bacillus entworfen werden. 

Bei einer entsprechenden Verwendung handelt es sich demzufolge um eine der zuvor 
beschriebenen erfindungsgemalien Nukleinsauren beziehungsweise um die zumindest 
teilweise nichtcodierenden flankierenden Bereiche zu diesen Nukleinsauren. Die 
verschiedenen hierunter fallenden Ausfuhrungsformen sind entsprechend bevorzugt. 

In bevorzugten Ausfuhrungsformen dieser Verwendungen handelt es sich bei dem 
grampositiven Bakterium vorzugsweise um eines der Gattungen Clostridium oder Bacillus 
und um eines, das naturlicherweise zur Sporulation befahigt ist, bei dem gleichzeitig mit 
recA ein Gen aus der Phase IV der Sporulation funktionell inaktiviert wird. 

Denn viele grampositiven Bakterien sind wie einleitend beschrieben in der Lage, unter 
entsprechend ungunstigen Umweltbedingungen den Vorgang der Sporulation einzuleiten. 
Dies kann erfindungsgemaS insofern fur Sicherheitsaspekte ausgenutzt werden, als in 
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Kombination mit der oben dargestellten funktionellen Inaktivierung von recA ein 
Sporulationsgen aus der vergleichsweise spaten Phase IV der Sporulation ebenfalis 
funktionell inaktiviert wird. Damit stehen der form ulierten Aufgabe entsprechend zwei 
gleichzeitig und erfindungsgemaB miteinander kombinierbare Systeme fur die Herstellung 
sicherer GVO zur Verfugung. Die Kombination beider Systeme war bislang noch nicht 
bekannt, insbesondere nicht zu diesem Zweck. 

Besonders erfolgreich konnte die Inaktivierung von Sporulationsgenen an Spezies der 
Gattungen Clostridium und Bacillus realisiert werden, weshalb die hierdurch 
gekennzeichneten Ausfuhrungsformen entsprechend bevorzugt sind. 

Insbesondere ist es uberraschend, daB die Verhinderung der Sporulation erst in einem so 
spaten Stadium fur diesen Zweck erfolgreich ist. Zwar werden in spolV-Mutanten von 
B. licheniformis unter entsprechenden Bedingungen noch Sporen (die sogenannten 
„Phase-Grau-Sporen") gebildet, doch sind diese steril und nicht mehr in der Lage 
auszukeimen. Insofern tragt diese Mutation dem Sicherheitsaspekt Rechnung. Bisher war 
eine Unterbindung der Sporulation eher zu einem fruheren Zeitpunkt favorisiert worden. 
Die Inaktivierung in Phase IV sorgt zusatzlich jedoch dafur, daB die in den fruheren 
Sporulations-Phasen aktiven Faktoren auch weiterhin in den Mutanten gebildet werden. 
Ohne an diese Theorie gebunden sein zu wollen, kann man vermuten, dafl zumindest 
einige dieser Faktoren von den Zellen auch fur die normalen wahrend der Fermentation 
ablaufenden Stoffwechselvorgange benotigt werden. Bei dem Ausschalten zu einem 
fruhreren Zeitpunkt stunden sie nicht mehr zur Verfugung. Umgekehrt besteht die 
vorteilhafte Wirkung der Inaktivierung der Sporulation in Phase IV darin, daft der hierdurch 
stattfindende Eingriff in die Physiologie der Zellen nicht so gravierend ist und die 
Fermentation an sich weniger beeintrachtigt wird als bei einem fruheren Ausschalten 
dieser Gene. 

Bevorzugt ist eine derartige Verwendung, bei der es sich bei dem inaktivierten Gen aus 
der Phase IV der Sporulation in der Nomenklatur von B. subtilis urn eines der Gene 
spolVA, spolVB, spolVCA, spolVCB, spolVFA, spolVFB oder yqfD beziehungsweise urn 
ein hierzu homologes Gen handelt, vorzugsweise im Fall von B. subtilis urn das Gen yqfD, 
im Fall von Bacillus licheniformis urn das Gen spolV und in jedem anderen Fall urn ein 
hierzu homologes Gen. 
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All diese Gene sind an sich bekannt und fur diese Phase der Sporulation beschrieben. 
Das B. subtilis-Gen spolVA codiert fur das Phase-IV-Sporulationsprotein A, das in den 
Datenbanken Swiss-Prot (Geneva Bioinformatics (GeneBio) S.A., Genf, Schweiz; 
http://www.genebio.com/sprot.html) und NCBI (siehe oben) unter der Nummer P35149 
hinterlegt ist. Es spielt fur die Bildung einer intakten Sporenhulle und deren 
Zusammenbau eine Rolle. Die Aminosauresequenz des zugehorigen Faktors SpolVA wird 
in SEQ ID NO. 8 der vorliegenden Anmeldung angegeben, und zwar als die vom 
Programm Patentln erzeugte Obersetzung der vorangegangenen DNA-Sequenz. Die 
zugehorige Nukleotidsequenz kann der Datenbank Subtilist des Institute Pasteur, Paris, 
Frankreich (http://genolist.pasteur.fr/SubtiList/genome.cgi) unter der Nummer BG10275 
entnommen werden und ist im Sequenzprotokoll in SEQ ID NO. 7 angegeben, und zwar 
zusammen mit den 200 vor dem S'-Ende und den 197 hinter dem 3'-Ende gelegenen 
Nukleotiden. Hierbei wird, ungeachtet derTatsache, da(J diese Randsequenzen durchaus 
sinnvolle genetische Informationen, insbesondere Regulationseiemente oder auch 
Abschnitte anderer Gene enthalten durften, die komplette unter SEQ ID NO. 7 
angegebene Nukleotidsequenz von 1 bis 1876 erfindungsgemaS als Gen spolVA 
bezeichnet. Der codierende Bereich erstreckt sich von den Positionen 201 bis 1679; das 
erste Codon, das heifit die Positionen 201 bis 203 werden in vivo nicht als Leucin sondern 
als Methionin translatiert. 

Das B. subtilis-Gen spolVB codiert fur das Phase-IV-Sporulationsprotein B, das in den 
Datenbanken Swiss-Prot und NCBI unter der Nummer P17896 hinterlegt ist. Es ist fur den 
Sigma-Faktor-K-abhangigen Obergangspunkt wahrend der Sporulation beziehungsweise 
dessen Aktivierung in der Mutterzelle von Bedeutung. Es spielt fur die 
interkompartimentelle Signalubertragung eine Rolle, wahrscheinlich uber den 
hydrophoben N-Terminus. Die Aminosauresequenz des Faktors SpolVB wird in SEQ ID 
NO. 10 der vorliegenden Anmeldung angegeben, und zwar als die vom Programm 
Patentln erzeugte Obersetzung der vorangegangenen DNA-Sequenz. Die zugehorige 
Nukleotidsequenz kann der Datenbank Subtilist unter der Nummer BG10311 entnommen 
werden und ist im Sequenzprotokoll in SEQ ID NO. 9 angegeben, und zwar zusammen 
mit den 200 vor dem 5'-Ende und den 197 hinter dem 3-Ende gelegenen Nukleotiden. 
Hierbei wird, ungeachtet der Tatsache, daB diese Randsequenzen durchaus sinnvolle 
genetische Informationen, insbesondere Regulationseiemente oder auch Abschnitte 
anderer Gene enthalten durften, die komplette unter SEQ ID NO. 9 angegebene 
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Nukleotidsequenz von 1 bis 1675 erfindungsgemaR als Gen spoiVB bezeichnet. Der 
codierende Bereich erstreckt sich von den Positionen 201 bis 1478. 

Das B. subtilis-Gen spolVCA codiert fur eine putative ortsspezifische DNA-Rekombinase, 
die in den Datenbanken Swiss-Prot und NCBI unter der Nummer P17867 hinterlegt ist. 
Sie spielt wahrscheiniich eine Rolle, um die Gene spolllC und spolVCB zu rekombinieren, 
woraus der Sigmafaktor K hervorgeht. Die Aminosauresequenz dieser Rekombinase wird 
in SEQ ID NO. 12 der vorliegenden Anmeldung angegeben, und zwar als die vom 
Programm Patentln erzeugte Qbersetzung der vorangegangenen DNA-Sequenz. Die 
zugehorige Nukleotidsequenz kann der Datenbank Subtilist unter der Nummer BG10458 
entnommen werden und ist im Sequenzprotokoll in SEQ ID NO. 11 angegeben, und zwar 
zusammen mit den 200 vor dem 5-Ende und den 197 hinter dem 3'-Ende gelegenen 
Nukleotiden. Hierbei wird, ungeachtet der Tatsache, dalJ diese Randsequenzen durchaus 
sinnvolle genetische Informationen, insbesondere Regulationselemente oder auch 
Abschnitte anderer Gene enthalten durften, die komplette unter SEQ ID NO. 11 
angegebene Nukleotidsequenz von 1 bis 1900 erfindungsgemafc als Gen spolVCA 
bezeichnet. Der codierende Bereich erstreckt sich von den Positionen 201 bis 1703; das 
erste Codon, das hei(Jt die Positionen 201 bis 203 werden in vivo nicht als Valin sondern 
als Methionin translatiert. 

Das B. subtilis-Gen spolVCB codiert fur den RNA-Polymerase-Sigmafaktor-K-Precursor, 
der in den Datenbanken Swiss-Prot und NCBI unter der Nummer P12254 hinterlegt ist. 
Der Rest dieses Faktors wird von dem Gen spolllC codiert, welches auf dem Chromosom 
ca. 10 kb entfernt ist, wobei der dazwischenliegende Bereich als SKIN bezeichnet wird. 
Durch Excision dieses Fragments in der unmittelbar vorangehenden Sporuiationsphase 
wird der aktive Sigma-Faktor K erhalten, welcher seinerseits als Transkriptionsfaktor wirkt. 
Die Aminosauresequenz des Teilfaktors SpolVCB wird in SEQ ID NO. 14 der 
vorliegenden Anmeldung angegeben, und zwar als die vom Programm Patentln erzeugte 
Obersetzung der vorangegangenen DNA-Sequenz. Die zugehorige Nukleotidsequenz 
kann der Datenbank Subtilist unter der Nummer BG10459 entnommen werden und ist im 
Sequenzprotokoll in SEQ ID NO. 13 angegeben, und zwar zusammen mit den 200 vor 
dem S'-Ende und den 197 hinter dem 3'-Ende gelegenen Nukleotiden. Hierbei wird, 
ungeachtet der Tatsache, daft diese Randsequenzen durchaus sinnvolle genetische 
Informationen, insbesondere Regulationselemente oder auch Abschnitte anderer Gene 
enthalten durften, die komplette unter SEQ ID NO. 13 angegebene Nukleotidsequenz von 
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1 bis 868 erfindungsgemaft ais Gen spolVCB bezeichnet. Der codierende Bereich 
erstreckt sich von den Positionen 201 bis 671. 

Das B. subtilis-Gen spolVFA codiert fur das Phase IV-SporuIationsprotein FA. Dieser 
Faktor, der vermutlich in der Lage ist, mit SpolVFB (siehe unten) ein Heterodimer zu 
bilden, erfullt wahrscheinlich die Aufgabe, diesen Faktor zu stabilisieren aber dadurch 
gleichzeitig auch zu inhibieren. Deshalb wird SpolVFA auch schon zu einem fruheren 
Zeitpunkt, vermutlich in Phase II gebildet. Die Aminosauresequenz von SpolVFA ist in den 
Datenbanken Swiss-Prot und NCBI unter der Nummer P26936 hinterlegt. Sie wird in SEQ 
ID NO. 16 der vorliegenden Anmeldung angegeben, und zwar als die vom Programm 
Patentln erzeugte Obersetzung der vorangegangenen DNA-Sequenz. Die zugehorige 
Nukleotidsequenz kann der Datenbank Subtilist unter der Nummer BG10331 entnommen 
werden und ist im Sequenzprotokoll in SEQ ID NO. 15 angegeben, und zwar zusammen 
mit den 200 vor dem 5-Ende und den 197 hinter dem 3'-Ende gelegenen Nukleotiden. 
Hierbei wird, ungeachtet der Tatsache, dali diese Randsequenzen durchaus sinnvolle 
genetische Informationen, insbesondere Regulationselemente oder auch Abschnitte 
anderer Gene enthalten durften, die komplette unter SEQ ID NO. 15 angegebene 
Nukleotidsequenz von 1 bis 1 192 erfindungsgemali als Gen spolVFA bezeichnet. Der 
codierende Bereich erstreckt sich von den Positionen 201 bis 995. 

Das B. subtilis-Gen spolVFB codiert fur das Phase-IV-Sporulationsprotein FB. Dabei 
handelt es sich urn eine membranassoziierte Metalloprotease, die vermutlich fur die 
Prozessierung von Pro-Sigma K zu Sigma K zustandig ist; sie wird ebenfalls bereits in 
Phase II der Sporulation gebildet. Die Aminosauresequenz von SpolVFB ist in den 
Datenbanken Swiss-Prot und NCBI unter der Nummer P26937 hinterlegt. Sie wird in SEQ 
ID NO. 18 der vorliegenden Anmeldung angegeben, und zwar als die vom Programm 
Patentln erzeugte Obersetzung der vorangegangenen DNA-Sequenz. Die zugehorige 
Nukleotidsequenz kann der Datenbank Subtilist unter der Nummer BG10332 entnommen 
werden und ist im Sequenzprotokoll in SEQ ID NO. 17 angegeben, und zwar zusammen 
mit den 200 vor dem 5'-Ende und den 197 hinter dem 3'-Ende gelegenen Nukleotiden. 
Hierbei wird, ungeachtet der Tatsache, daB diese Randsequenzen durchaus sinnvolle 
genetische Informationen, insbesondere Regulationselemente oder auch Abschnitte 
anderer Gene enthalten durften, die komplette unter SEQ ID NO. 17 angegebene 
Nukleotidsequenz von 1 bis 1264 erfindungsgemaB als Gen spolVFB bezeichnet. Der 
codierende Bereich erstreckt sich von den Positionen 201 bis 1067; das erste Codon, das 
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heifct die Positioner! 201 bis 203 werden in vivo nicht ais Leucin sondern als Methionin 
translatiert. 

Auch die beiden bevorzugten Gene gehen an sich aus dem Stand der Technik hervor. Die 
DNA- und Aminosauresequenzen von spo!V aus B. licheniformis sind in der Datenbank 
NCBI unter der Nummer AJ616332 hinterlegt. Dieser Faktor wird in der Diplomarbeit 
„Arbeiten zur Hersteliung einer sporulationsnegativen Mutante von Bacillus licheniformis" 
von M.Grone (2002), im Fachbereich Biologie der Westfalischen Wilhelms-Universitat 
Munster, Deutschland als ein fur die Sporulation von B. licheniformis essentieller Faktor 
beschrieben. Die zugehorigen, zum Teil auch regulatorische Bereiche umfassenden 
Sequenzen sind in der vorliegenden Anmeldung unter SEQ ID NO. 3 und 4 angegeben. 
Zu diesen Sequenzen ist zu bemerken, dafJ erfindungsgemafc der Bereich der Nukleotide 
1 bis 1792 als Gen spolV bezeichnet wird, wobei der eigentliche SpolV-codierende 
Abschnitt die Positionen 140 bis 1336 umfaGt; die Randsequenzen mogen wiederum 
andere genetische Elemente wie Regulationselemente oder Teile anderer Gene 
enthalten. Hierunter wird das erste Codon GTG der Positionen 140 bis 142 in vivo nicht 
als Valin sondern als Methionin translatiert. 

In dieser Arbeit wird auch auf den Faktor beziehungsweise das Gen yqfD aus B. subtilis 
hingewiesen, welches mit einer Homologie von 68% Identitat auf Aminosaureebene als 
das nachstahnliche bis dato bekannte Protein angesehen wird. Dieser Faktor ist in der 
Datenbank Swiss-Prot unter der Nummer P54469 angegeben; sowohl die 
Aminosauresequenz als auch die DNA-Sequenz mit beiden ca. 200 bp flankierenden 
Bereichen gehen aus der Datenbank Subtilist unter der Nummer BG1 1654 hervor. Der 
dortige Eintrag vermerkt, es sei zwar ein unbekanntes Protein, aber aufgrund der 
bestehenden Sequenzhomologien konne es als Ahnliches zum Phase-IV- 
Sporulationsprotein angesehen werden. Die zugehorigen Sequenzen konnen SEQ ID 
NO. 5 und 6 der vorliegenden Anmeldung entnommen werden. Zu diesen Sequenzen ist 
erganzend zu bemerken, dafc ungeachtet der ebenfalls angegebenen und moglicherweise 
andere genetische Elemente enthaltenden Randssequenzen erfindungsgemaU der 
Bereich der Nukleotide 1 bis 1594 als Gen yqfD bezeichnet wird, wobei der eigentliche 
proteincodierende Abschnitt die Positionen 201 bis 1397 umfaBt. Hierunter wird das erste 
Codon GTG der Positionen 201 bis 203 wie bei spolV aus B. licheniformis in vivo nicht als 
Valin sondern als Methionin translatiert. 
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Es ist zu erwarten, daft alle anderen grampositiven, naturlicherweise zur Sporulation 
befahigten Mikroorganismen uber Homoioge zu den genannten sieben Genen und davon 
abgeleitete Faktoren vergleichbarer Funktionen verfugen. Sie durften in an sich bekannter 
Weise unter Hybridisierung mit den in im Sequenzprotokoll angegebenen Nukleinsauren 
ohne weiteres identifizierbar sein, insbesondere mithilfe der beiden homologen 
Sequenzen SEQ ID NO. 3 beziehungsweise 5, womit eine gewisse Varianz uber Spezies- 
Grenzen hinweg ermoglicht wird. 

Eines dieser Gene, vorzugsweise yqfD / spoIV beziehungsweise dessen Homologes wird 
im Produktionsstamm erfindungsgemaft gleichzeitig mit recA inaktiviert, urn hieraus 
entsprechende Sicherheitsstamme zu erhalten. Vorteilhafterweise werden hierfur 
entsprechend den oben gemachten Ausfuhrungen zur Deletionsmutagenese die in SEQ 
ID NO. 3, 5, 7, 9, 11, 13, 15 oder 17 angegebenen Nukleinsauren selbst zur Inaktivierung 
verwendet. Damit ist es nicht einmal notig, die betreffenden homologen Gene aus den fur 
die Produktion verwendeten Spezies selbst zu identifizieren. Hierbei ist zu erwarten, daft 
diese Deletionen umso erfolgreicher sind, je enger die betreffenden Spezies mit B. subtilis 
beziehungsweise B. Hcheniformis verwandt sind. Denn hiermit sollte eine zunehmende 
Homologie der betreffenden Gene verbunden sein. Aus diesem Grund sind im 
Sequenzprotokoll jeweils auch die ca. 200 bp umfassenden Randsequenzen angegeben, 
denn damit konnen entsprechend den fur recA gemachten Ausfuhrungen Konstrukte 
gebildet werden, die die fur ein Crossing-over notigen mindestens 70 bis 150 Positionen 
umfassenden Bereiche in vollstandig flankierenden Bereichen enthalten. 

Erfindungsgemaft ist es moglich, zusammen mit recA mehrere der genannten Phase IV- 
Gene zu inaktivieren und dadurch Sicherheitsstamme zu erhalten, die neben der 
Unfahigkeit zur RecA-vermittelten DNA-Rekombination nicht in der Lage sind, reife 
Sporen zu bilden. Erfindungsgemaft reicht es hierfur jedoch aus, neben recA lediglich 
eines dieser Gene zu inaktivieren, weshalb in einer bevorzugten derartigen Verwendung 
genau ein Gen aus der Phase IV der Sporulation funktionell inaktiviert wird. 

Hierdurch werden Sicherheitsstamme fur die biotechnologische Produktion erhalten. 
Diese sind aufterhalb der optimalen Fermentationsbedingungen weniger gut uber- 
lebensfahig, insbesondere unter Umweltbedingungen, die schlechte Nahrstoffversorgung 
und DNA-schadigende Einflusse, etwa durch UV-Strahlung oder aggressive chemische 
Verbindungen, umfassen. Die genannte erste Gruppe von Umwelteinflussen wurde bei 
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natQrlicherweise zur Speculation befahigten grampositiven Bakterien den Dbergang in die 
Dauerform der Sporen induzieren; die zweite Gruppe von Einflussen kann von Mikro- 
organismen natQrlicherweise uber RecA-vermittelte DNA-Reparatur- und Rekombina- 
tionsprozesse ausgeglichen werden. Wenn die Zellen zu beidem nicht mehr oder nur 
noch stark eingeschrankt in der Lage sind, sind sie erfindungsgemaB als Sicherheits- 
stamme geeignet. 

Ferner ist es moglich, zusammen mit recA eines oder mehrere der im Stand der Technik 
bekannten Gene zu inaktivieren und dadurch Sicherheitsstamme zu erhalten, die neben 
der Unfahigkeit zur RecA-vermittelten DNA-Rekombination und zur Bildung reifer Sporen 
auch Qber diese zusatzlichen Eigenschaften gekennzeichnet sind. Dazu geh6ren neben 
„aktiven", die Lebensfahigkeit unterbindenden und entsprechend stringent zu regulie- 
renden Systemen auch jene, die im einleitend dargestellten Stand der Technik als 
..passive" Systeme zur Erzeugung von GVO bezeichnet worden sind. dazu gehoren 
insbesondere inaktivierende Mutationen in einem oder mehreren der folgenden Gene: 
epr, rp-l, rp-ll, isp-1, apr, npr, spoOA, bpr, rsp, mpr, vpr, spoOA, spoll:D, spollAC, spo2, 
spo3, sigE, sigF, spollE, spollSB, sigG, spolVCB, spolllC, nprM und das Gen fur die 
Isopropylmalat-Dehydrogenase (leuB). Diese Genbezeichnungen sind dem in der 
Einleitung zur vorliegenden Anmeldung dargestellten Stand der Technik entnommen. 
Somit sind an dieser Stelle mit diesen AbkQrzungen jeweils die in den einleitend 
genannten Anmeldungen und Publikationen beschriebenen Bedeutungen gemeint. Sollten 
fur dieselben Gene beziehungsweise Gengruppen, codierend fur dieselben oder 
homologe Proteine, im Stand der Technik weitere Namen etabliert sein, insbesondere fur 
die Homologen in anderen Bakterienspezies als denen, die den erwahnten Arbeiten 
zugrundegelegen haben, so gilt das hier Gesagte entsprechend. 

ErfindungsgemaB ist es jedoch nicht unbedingt notwendig, neben recA und 
gegebenenfalls zusatzlich einem Sporulationsphasen IV-Gen ein weiteres Gen zu 
inaktivieren, so daB vorzugsweise auf diese weiteren Mutationen weitgehend verzichtet 
wird. Hiermit ist der in der Aufgabe zur vorliegenden Anmeldung geforderte Vorteil 
verbunden, moglichst wenige Sicherheitssysteme parallel in derselben Zelle zu etablieren. 
Hiermit wird der Arbeitsaufwand geringer gehalten, als wenn man, wie in den genannten 
Arbeiten zu B. megaterium vorgeschlagen, vier verschiedene Deletionen vornehmen 
mQBte. Das ist insbesondere dann relevant, wenn die betreffenden Zellen zuerst - solange 
sie noch zur Rekombination in der Lage sind - mit den fur die Produktion relevanten 
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Transgenen versehen werden und dann erst in Sicherheitsstamme, insbesondere in einen 
recA-Minus-Phanotyp uberfuhrt werden. Nurfur sehr kritische Falle, etwa hochpathogene 
Stamme, sind derartige weitere Mutationen angezeigt. 

Aufgrund der mit der vorliegenden Anmeldung zur Verfugung gestellten Sequenzen 
werden Sporulationsdefekte in den Genen spolVA, spolVB, spoIVCA, spolVCB, spolVFA, 
spolVFB oder yqfD in der Nomenklatur von B. subtilis beziehungsweise im Fall von 
Bacillus licheniformis in dem Gen spoIV beziehungsweise den je nach Wirtszelle 
vorhandenen hierzu homologen Genen erzeugt. 

Diese Homologie lalit sich in erster Naherung uber einen Sequenzvergleich erschlie&en. 
Zur Kontrolle kann im vorliegenden, fur die biotechnlogische Produktion vorgesehenen 
Mikroorganismus-Stamm das fragliche Gen inaktiviert und uber eine Wiederherstellung 
des Phanotyps (Rescue) die funktionelle Obereinstimmung der betreffenden Gene 
uberpruft werden. Oberfuhrt die parallele Bereitstellung einer erfindungsrelevanten 
spolVA, spolVB, spoIVCA, spolVCB, spolVFA, spolVFB, yqfD- oder spolV-Kopie die 
betreffende Knock-out-Mutante wieder in einen Sporulations-positiven Phanotyp, so ware 
damit der Nachweis erbracht, daft auch eine funktionelle Austauschbarkeit der 
betrachteten Gene besteht. Unter homologen Genen zu den genannten Phase-IV- 
Sporulationsgenen werden erfindungsgemaG also insbesondere solche verstanden, die 
einem derartigen „Rescue" zuganglich sind. Wenn das moglich ist, handelt es sich um ein 
bevorzugt verwendetes Sporulationsgen. Diese Kontrolle ist insbesondere deshalb mit 
zumutbarem Arbeitsaufwand moglich, weil zum einen erfindungsgemali eben eine solche 
funktionell inaktive Mutante erzeugt werden soil und zum anderen uber das 
Sequenzprotokoll zur vorliegenden Anmeldung die betreffenden Sequenzen aus 
B. subtilis und die besonders bevorzugte davon zusatzlich aus B. licheniformis zur 
Verfugung gestellt werden, uber die ein derartiger Rescue vorgenommen werden kann. 

In bevorzugten Ausfuhrungsformen erfolgt die erfindungsgemafce, bisher beschriebene 
Verwendung zur funktionellen Inaktivierung der Gene spolVA, spolVB, spoIVCA, 
spolVCB, spolVFA, spolVFB, yqfD oder spoIV beziehungsweise den hierzu jeweils 
homologen Genen mithilfe der Sequenzen SEQ ID NO. 3, 5, 7, 9, 11, 13, 15, oder 17 oder 
Teilen davon, vorzugsweise mithilfe von Teilen, die mindestens 70 bis 150 
zusammenhangende Nukleinsaurepositionen umfassen, besonders bevorzugt mithilfe von 
zwei solchen Teilen, die einen dazwischenliegenden Teil des Gens umschliefcen. 
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Denn wie oben beschrieben konnen Qber diese konkreten Sequenzen, insbesondere fur 
B. licheniformis und B. subtilis und nahe mit diesen verwandte Spezies entsprechende 
molekularbiologische Konstrukte hergestellt werden. Hierfur stehen alle oben zu recA 
ausgefuhrten Moglichkeiten zur Verfugung und sind entsprechend bevorzugt. 

Einen eigenen Gegenstand der vorliegenden Erfindung stellen die mit den beschriebenen 
Verfahren erhaltenen Mikroorganismen dar. In seiner allgemeinsten Formulierung handelt 
es sich dabei also um ein grampositives Bakterium, welches nicht Bacillus megaterium ist, 
bei dem das Gen recA funktionell inaktiviert ist. 

Denn wie bereits gesagt sind grampositive Bakterien, beispielsweise aufgrund ihrer 
Fahigkeit zur Sekretion von Wertstoffen und/oder ihrer vergleichsweise leichten Fermen- 
tierbarkeit die fur die Biotechnologie wichtigsten Mikroorganismen. Hierunter werden fur 
die verschiedenen Einsatzgebiete verschiedene Spezies bevorzugt, so werden nieder- 
molekulare Verbindungen wie etwa Aminosauren in besonders gro&em AusmaB mithilfe 
von Corynebacterien produziert; Bacillus und hierunter insbesondere B. licheniformis wird 
fQr die Produktion von extrazellularen Proteinen besonders geschatzt. Sie alle sind 
erfindungsgemaft einer funktionellen Inaktivierung von RecA zuganglich. 

Diese erfindungsgemaBen Bakterien zeichnen sich durch die beschriebenen 
Rekombinationsdefekte aus und weisen deshalb unter naturlichen Bedingungen, insbe- 
sondere in Konkurrenz mit anderen Mikroorganismen Nachteile hinsichtlich ihrer Dber- 
lebensfahigkeit auf und eignen sich somit als Sicherheitsstamme fQr die biotechnolo- 
gische Produktion. Hierbei handelt es sich aus den oben ausgefuhrten Grunden nicht um 
Bacillus megaterium. 

Den bisherigen AusfQhrungen entsprechend sind darunter solche grampositiven Bakterien 
bevorzugt, bei denen die funktionelle Inaktivierung Qber Punktmutagenese, teilweise 
Deletion Oder Insertion Oder vollstandige Deletion des fur das vollstandige Protein 
codierenden Bereichs erfolgt ist. 

Den bisherigen AusfQhrungen entsprechend sind weiterhin darunter solche grampositiven 
Bakterien bevorzugt, bei denen die funktionelle Inaktivierung Qber eine erfindungsgemaBe 
fur RecA codierende Nukleinsaure beziehungsweise Qber die zumindest teilweise 
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nichtcodierenden flankierenden Bereiche zu diesen Nukleinsauren erfolgt ist. Hierbei sind 
die Nukleinsauren den oben beschriebenen Homologiewerten entsprechend bevorzugt. 
Mikroorganismen, bei denen die funktionelle Inaktivierung mithilfe der in SEQ ID NO. 1 
angegebenen Nukleinsaure beziehungsweise Abschnitten davon erfolgt ist, stellen in 
dieser Hinsicht die am meisten bevorzugten Mikroorganismen dar. Entsprechend dem 
oben gesagten sind im Falle einer Mutagenese uber Crossing over vorzugsweise 
Randsequenzen von jeweils mindestens 70 bis 150 bp verwendet worden, was uber eine 
Sequenzierung der betreffenden chromosomalem Abschnitte Qberpruft werden kann. 

Den bisherigen Ausfuhrungen entsprechend sind weiterhin darunter solche grampositiven 
Bakterien und hierunter vorzugsweise solche der Gattungen Clostridium oder Bacillus, 
bevorzugt, die naturlicherweise zur Sporulation befahigt sind und bei denen gleichzeitig 
mit recA ein Gen aus der Phase IV der Sporulation funktionell inaktiviert ist. 

Den bisherigen Ausfuhrungen entsprechend sind weiterhin darunter solche grampositiven 
Bakterien bevorzugt, bei denen es sich bei dem inaktivierten Gen aus der Phase IV der 
Sporulation in der Nomenklatur von B. subtilis urn eines der Gene spolVA, spolVB, 
spolVCA, spolVCB, spolVFA, spolVFB oder yqfD beziehungsweise urn ein hierzu 
homologes Gen handelt, vorzugsweise im Fall von B. subtilis urn das Gen yqfD, im Fall 
von Bacillus licheniformis urn das Gen spolV und in jedem anderen Fall urn ein hierzu 
homologes Gen. 



In besonderen Fallen, etwa beim Einsatz hochpathogener Stamme konnen auch mehrere 
der genannten Sporulationsgene oder eines oder mehrere der im Stand der Technik be- 
schriebenen Gene oder Gengruppen spolV/yqfD/Homolog, epr, rp-l, rp-ll, isp-1, apr, npr, 
spoOA, bpr, rsp, mpr, vpr, spoOA, spoll:D, spollAC, spo2, spo3, sigE, sigF, spollE, 
spollSB, sigG, spolVCB, spolllC, nprM und/oder das Gen fur die Isopropylmalat- 
Dehydrogenase (leuB) funktionell inaktiviert werden. Unter diesen Abkurzungen sind 
jeweils die in den einleitend genannten Anmeldungen und Publikationen beschriebenen 
Bedeutungen zu verstehen, wobei eventuelle Synonyme entsprechend eingeschlossen 
werden. 



Den bisherigen Ausfuhrungen entsprechend handelt es sich dabei jedoch bevorzugt 
jeweils urn ein solches grampositives Bakterium, bei dem - neben der RecA-lnaktivierung 
- genau ein Gen aus der Phase IV der Sporulation funktionell inaktiviert ist. 
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Entsprechend dem oben Gesagten ist weiterhin jeweils ein solches derartiges 
grampositives Bakterium bevorzugt, bei dem die funktionelle Inaktivierung der Gene 
spolVA, spolVB, spolVCA, spoIVCB, spolVFA, spolVFB, yqfD Oder spolV 
beziehungsweise den hierzu jeweils homologen Genen mithilfe einer der Sequenzen SEQ 
ID NO. 3, 5, 7, 9, 11, 13, 15, oder 17 oder Teilen davon erfolgt ist, vorzugsweise mithilfe 
von Teilen, die mindestens 70 bis 150 zusammenhangende Nukleinsaurepositionen 
umfassen, besonders bevorzugt mithilfe von zwei solchen Teilen, die einen 
dazwischenliegenden Teil des Gens umschlielien. 

Dies laftt sich uber Praparationen der betreffenden DNA, beispielsweise der 
chromosomalen DNA eines erfindungsgemaften Stamms und Restriktionsanalyse oder 
PGR uberprufen. Als Primer hierfur konnen die jeweiligen flankierenden Sequenzen 
verwendet werden, wobei die GroRe des PCR-Produkts AufschiulS uber das 
Vorhandensein und gegebenenfalls die Grolie von Inserts gibt. 

Entsprechend den bisherigen Ausfuhrungen sind unter den erfindungsgemafien 
grampositiven Bakterien besonders solche bevorzugt, bei denen es sich urn Vertreter der 
Gattungen Clostridium oder Bacillus handelt, insbesondere urn solche der Spezies 
Bacillus subtilis, B. licheniformis, B. amyloliquefaciens, B. stearothermophilus, B. globigii, 
B. clausii oder B. lentus, und ganz besonders urn Stamme von B. licheniformis. 

Einen eigenen Erfindungsgegenstand stellen die Verfahren zur Fermentation eines 
erfindungsgemafJen grampositiven Bakteriums dar. 

Denn diese Verfahren zeichnen sich dadurch aus, daB RecA, vorzugsweise im 
Zusammenspiel mit den dargestellten bevorzugten Ausfuhrungsformen nicht aktiv ist und 
der betreffende Stamm im Falle einer versehentlichen Freisetzung in die Umgebung der 
Anlage ein deutlich minimiertes Sicherheitsrisiko darstellt. Fur Verfahren zur Fermentation 
werden entsprechende Sicherheitsanforderungen gestellt, so dalJ sie gegebenenfalls nur 
dann durchfuhrbar sind, wenn sie diese Anforderungen erfullen. 

Vorzugsweise handelt es sich dabei urn Verfahren zur Herstellung eines Wertstoffs, 
insbesondere einer niedermolekularen Verbindung oder eines Proteins. 
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Zwar ist es vorteilhaft, wenn entsprechende Stamme auch im LabormafJstab eingesetzt 
werden. Doch sind hierdie ubrigen Rahmenbedingungen im allgemeinen leichterzu 
erfullen. Aulierdem besteht das Haupeinsatzgebiet der Fermentation von Mikroorga- 
nismen in der biotechnologischen Herstellung von Wertstoffen. 

Der Bedeutung dieser Wertstoffe entsprechend sind hierunter solche Verfahren 
bevorzugt, bei denen es sich bei der niedermolekularen Verbindung urn einen Naturstoff, 
einen Nahrungsmittelerganzungsstoff oder urn eine pharmazeutisch relevante Verbindung 
handelt. 

Hierunter sind beispielsweise Aminosauren oder Vitamine zu nennen, die besonders ais 
Nahrungsmittelerganzungsstoffe Verwendung finden. Bei pharmazeutisch relevanten 
Verbindungen kann es sich urn Vor- oder Zwischenstufen zu Medikamenten oder sogar 
um diese selbst handeln. in all diesen Fallen spricht man auch von Biotransformation, 
wonach die Stoffwechseleigenschaften der Mikroorganismen ausgenutzt werden, um die 
ansonsten aufwendige chemische Synthese ganz oder zumindest in einzelnen Schritten 
zu ersetzen. 

In nicht minder bevorzugten Verfahren handeit es sich bei dem Protein um ein Enzym, 
insbesondere eines aus der Gruppe der a-Amylasen, Proteasen, Cellulasen, Lipasen, 
Oxidoreduktasen, Peroxidasen, Laccasen, Oxidasen und Hemicellulasen. 

Industrielle Enzyme, die mit derartigen Verfahren hergestellt werden, finden 
beispielsweise in der Nahrungsmittelindustrie Verwendung. So dienen a-Amylasen 
beispielsweise dazu, um das Altbackenwerden von Brot zu verhindern oder um 
Fruchtsafte zu klaren. Proteasen werden zum AufschluB von Proteinen verwendet. All 
diese Enzyme sind fur den Einsatz in Wasch- und Reinigungsmitteln beschrieben, wobei 
insbesondere die von grampositiven Bakterien bereits naturlicherweise hergestellten 
Subtilisin-Proteasen einen prominenten Platz einnehmen. Insbesondere in der Textil- und 
Lederindustrie dienen sie der Aufarbeitung der naturlichen Rohstoffe. Ferner konnen all 
diese Enzyme wiederum im Sinne der Biotransformation als Katalysatoren fur chemische 
Reaktionen eingesetzt werden. 

Wie einleitend in der Aufgabe formuliert war es erwunscht, ein solches Sicherheitssystem 
zu finden, das nicht so speziell ist, daB es nicht auch in anderen molekularbiologischen 
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Ansatzen Verwendung finden konnte. Derartige Ansatze konnen zu einem weiteren 
eigenstandigen Erfindungsgegenstand zusammengefaftt werden. 

Das bedeutet allgemein formuliert die Verwendung des oben beschriebenen Faktors 
RecA in einem molekularbiologischen Reaktionsansatz. Hierfiir werden dessen 
naturlicherweise vorhandenen Aktivitaten ausgenutzt. 

Dementsprechend bevorzugt ist die Verwendung zum Stabilisieren einzelstrangiger DNA 
insbesondere bei einer DNA-Polymerisation, bei in vitro erfolgenden Rekombinations- 
vorgangen, oder zum Oberfuhren doppelstrangiger DNA in einzelstrangige DNA oder 
umgekehrt. 

Denn RecA ist ein DNA-einzelstrangbindendes Protein, welches wie erlautert auch eine 
gewisse Affinitat zu doppelstrangiger DNA aufweist. Bei dem naturlichen ProzeG des 
Crossing over im Zuge der homologen Rekombination kommt diese Funktion zum Tragen. 
So kann RecA beispielsweise einer PGR oder einer Preparation von Phagen-DNA zu- 
gegeben werden, urn die Einzelstrange zu stabilisieren. Wenn in vitro Rekombinations- 
vorgange nachvollzogen werden, etwa beim Einfuhren von Mutationen (so auch bei den 
oben ausgefuhrten erfindungsgemalJen Mutationen), kann dies von RecA unterstutzt 
werden. SchlieBlich ist unter dem Oberfuhren doppelstrangiger DNA in einzelstrangige 
DNA oder umgekehrt eine Gyrase- oder Gyrase-unterstutzende Funktion gemeint. Dies 
kann fur die Beeinflussung der DNA-Topologie, etwa bei der Arbeit mit Plasmid-DNA 
ausgenutzt werden. 

Einen eigenen Erfindungsgegenstand stellen Vektoren dar, die eine zuvor beschriebene 
Nukleinsaure enthalten. Denn auch in dieser Form wird die vorliegende Erfindung 
verwirklicht. So kann diese DNA in Form von Klonierungsvektoren molekularbiologisch 
bearbeitet oder gelagert werden. 

Vorzugsweise handelt es sich bei einem solchen Vektor urn einen Expressionsvektor. 
Denn dieser kann dazu ausgenutzt werden, urn ein erfindungsgemafces RecA 
herzustellen und den genannten Anwendungen des Faktors zuzufQhren. 

Einen eigenen Erfindungsgegenstand stellen dementsprechend auch Verfahren zur 
Herstellung eines zuvor beschriebenen Faktors RecA dar. 
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Vorzugsweise handelt es sich dabei urn Verfahren, die unter Einsatz einer der oben 
beschriebenen Nukleinsauren, insbesondere solchen mit zunehmenden Hologiewerten 
zur SEQ ID NO. 1 erfolgen, vorzugsweise eines entsprechenden Expressionsvektors und 
weiter bevorzugt durch Fermentation eines diese Nukleinsaure beziehungsweise diesen 
Expressionsvektor enthaltenden Wirts. 

So wird die vorliegende Erfindung dadurch verwirklicht, dafi eine Zelle ein solches Gen in 
Form einer chromosomalen Kopie erhalt und translatiert. Leichter steuerbar erscheint 
demgegenQber die Bereitstellung dieses Gens in Form eines Plasmids, das 
gegebenenfalis in mehreren Kopien fur die Bildung dieses Faktors sorgt. 

Einen eigenen Erfindungsgegenstand stellt die Verwendung der fur einen Faktor RecA 
codierenden Nukleinsaure zur Expression dieses Faktors dar. Denn entspechend dem 
oben Gesagten wird dadurch die vorliegende Erfindung zumindest in einem Aspekt 
verwirklicht. 

Vorzugsweise dient das dazu, urn diesen Faktor selbst herzustellen, insbesondere in 
einem oben beschriebenen Verfahren. Alternativ hierzu kann die intrazellulare Expression 
auch dazu dienen, urn molekularbiologische Aktivitaten der betreffenden Zellen zu 
modulieren, insbesondere bei in vivo erfolgenden Rekombinationsvorgangen. 

Hierbei ist beispielsweise an die Inaktivierung durch einen Antisense- Oder RNA- 
Interferenz-Ansatz gedacht, nach welchem die fur RecA codierende mRNA gezielt 
ausgeschaltet oder nur in einem Teil translatierbar macht. Hierdurch kann die Expression 
dieses Faktors ganz gezielt moduliert werden. Das gilt sowoh! fur biotechnologische 
Produktionsstamme als auch fur Laboransatze zum Studium molekularbiologischer 
Aspekte. 

Hierzu gehort schlielSlich auch eine derartige Verwendung der fur einen Faktor RecA 
codierenden, oben beschriebenen Nukleinsaure zur Inaktivierung dieses Faktors oder des 
Gens recA in einem in vitro-Ansatz, insbesondere uber Wechselwirkung mit einer 
zugehorigen Nukleinsaure. Das kann besonders fur in-vitro-Transkriptions- oder- 
Translationsansatze vorteilhaft sein, urn Rekombinationsvorgange zu unterbinden. 
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Beschreibung der Figuren 

Figur 1: Aminosauresequenz-Alignment von SEQ ID NO. 2 mit denen der im Stand 

der Technik beschriebenen nachstahnlichen Rec-Faktoren. 
Dabei bedeuten: 

1: Faktor RecA aus B. licheniformis DSM 13 (SEQ ID NO. 2) 

2: Faktor RecA aus B. amyloliquefaciens (AJ515542 in NCBI) 

3: Faktor RecA aus B. subtilis (Z991 12 in NCBI; Region 161035 bis 162078) 

4: Faktor RecE aus B. subtilis (X52132 in NCBI) 

Figur 2: Nukleinsauresequenz-Alignment von SEQ ID NO. 1 mit denen der im Stand 

der Technik beschriebenen nachstahnlichen rec-Gene. 
Dabei bedeuten: 

1: Gen recA aus B. licheniformis DSM 13 (SEQ ID NO. 1) 

2: Gen recA aus B. amyloliquefaciens (AJ515542 in NCBI) 

3: Gen recA aus B. subtilis (Z991 12 in NCBI; Region 161035 bis 162078) 

4: Gen recE aus B. subtilis (X52132 in NCBI) 
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Patentanspruche 



1 . Faktor RecA mit einer Aminosauresequenz, die zu der in SEQ ID NO. 2 angegebenen 
Aminosauresequenz mindestens zu 96% identisch ist. 

2. Faktor nach Anspruch 1 mit einer Aminosauresequenz, die zu der in SEQ ID NO. 2 
angegebenen Aminosauresequenz zunehmend bevorzugt mindestens zu 96,5%, 
97%, 97,5%, 98%, 98,5%, 99%, 99,5% und ganz besonders bevorzugt zu 100% 
identisch ist. 

3. Faktor RecA, codiert von einer Nukleinsaure, deren Nukleotidsequenz zu der in SEQ 
ID NO. 1 angegebenen Nukleotidsequenz mindestens zu 85% identisch ist. 

4. Faktor nach Anspruch 3, codiert von einer Nukleinsaure, deren Nukleotidsequenz zu 
der in SEQ ID NO. 1 angegebenen Nukleotidsequenz zunehmend bevorzugt 
mindestens zu 87,5%, 90%, 92,5%, 95%, 96%, 97%, 98%, 99% und ganz besonders 
bevorzugt zu 1 00% identisch ist. 

5. Fur einen Faktor RecA codierende Nukleinsaure, deren Nukleotidsequenz zu der in 
SEQ ID NO. 1 angegebenen Nukleotidsequenz mindestens zu 85% identisch ist. 

6. Nukleinsaure nach Anspruch 6, deren Nukleotidsequenz zu der in SEQ ID NO. 1 
angegebenen Nukleotidsequenz zunehmend bevorzugt mindestens zu 87,5%, 90%, 
92,5%, 95%, 96%, 97%, 98%, 99% und ganz besonders bevorzugt zu 100% identisch 
ist. 

7. Nukleinsaure nach Anspruch 5 oder 6, codierend fur einen Faktor RecA nach einem 
der Anspruche 1 bis 4. 

8. Verwendung einer fur einen Faktor RecA codierenden Nukleinsaure zur funktionellen 
Inaktivierung des Gens recA in einem grampositiven Bakterium, welches nicht Bacillus 
megaterium ist. 
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9. Verwendung nach Anspruch 8, wobei eine fur ein nichtaktives Protein codierende 
Nukleinsaure mit einer Punktmutation eingesetzt wird. 

10. Verwendung nach Anspruch 8, wobei eine Nukleinsaure mit einer Deletions- oder 
Insertionsmutation eingesetzt wird, vorzugsweise umfassend die jeweils mindestens 
70 bis 150 Nukleinsaurepositionen umfassenden Randsequenzen desfur das Protein 
codierenden Bereichs. 

1 1 . Verwendung nach Anspruch 8, wobei Nukleinsauren mit insgesamt zwei 
Nukleinsaureabschnitten eingesetzt werden, die jeweils mindestens 70 bis 150 
Nukleinsaurepositionen umfassen und damit den fur das Protein codierenden Bereich 
zumindest teilweise, vorzugsweise vollstandig flankieren. 

12. Verwendung nach einem der Anspruche 8 bis 11, wobei es sich urn eine Nukleinsaure 
nach einem der Anspruche 5 bis 7 handelt, beziehungsweise urn die zumindest 
teilweise nichtcodierenden flankierenden Bereiche zu diesen Nukleinsauren. 

13. Verwendung nach einem der Anspruche 8 bis 12, wobei das grampositive Bakterium 
vorzugsweise eines der Gattungen Clostridium oder Bacillus, natOrlicherweise zur 
Sporulation befahigt ist und gleichzeitig mit recA ein Gen aus der Phase IV der 
Sporulation funktionell inaktiviert wird. 

14. Verwendung nach Anspruch 13, wobei es sich bei dem inaktivierten Gen aus der 
Phase IV der Sporulation in der Nomenklatur von B. subtilis urn eines der Gene 
spolVA, spolVB, spolVCA, spolVCB, spolVFA, spolVFB oder yqfD beziehungsweise 
urn ein hierzu homologes Gen handelt, vorzugsweise im Fall von B. subtilis urn das 
Gen yqfD, im Fall von Bacillus licheniformis urn das Gen spolV und in jedem anderen 
Fall urn ein hierzu homologes Gen. 

15. Verwendung nach Anspruch 13 oder 14, wobei genau ein Gen aus der Phase IV der 
Sporulation funktionell inaktiviert wird. 

16. Verwendung nach Anspruch 14 oder 15, wobei die funktionelle Inaktivierung der Gene 
spolVA, spolVB, spolVCA, spolVCB, spolVFA, spolVFB, yqfD oder spolV 
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beziehungsweise den hierzu jeweils homologen Genen mithilfe der Sequenzen SEQ 
ID NO. 3, 5, 7, 9, 11, 13, 15, oder 17 oder Teilen davon erfolgt, vorzugsweise mithilfe 
von Teilen, die mindestens 70 bis 150 zusammenhangende Nukleinsaurepositionen 
umfassen, besonders bevorzugt mithilfe von zwei solchen Teilen, die einen 
dazwischenliegenden Teil des Gens umschliefcen. 

17. Grampositives Bakterium, welches nicht Bacillus megaterium ist, bei dem das Gen 
recA funktionell inaktiviert ist. 

18. Grampositives Bakterium nach Anspruch 17, wobei die funktionelle Inaktivierung Ober 
Punktmutagenese, teilweise Deletion oder Insertion oder vollstandige Deletion des fur 
das vollstandige Protein codierenden Bereichs erfolgt ist. 

19. Grampositives Bakterium nach Anspruch 17 oder 18, wobei die funktionelle 
Inaktivierung uber eine Nukleinsaure nach einem der AnsprQche 5 bis 7 
beziehungsweise Qber die zumindest teilweise nichtcodierenden flankierenden 
Bereiche zu diesen Nukleinsauren erfolgt ist. 

20. Grampositives Bakterium nach einem der Anspruche 17 bis 19, vorzugsweise eines 
der Gattungen Clostridium oder Bacillus, das naturlicherweise zur Sporulation befahigt 
ist und bei dem gleichzeitig mit recA ein Gen aus der Phase IV der Sporulation 
funktionell inaktiviert ist. 

21. Grampositives Bakterium nach Anspruch 20, wobei es sich bei dem inaktivierten Gen 
aus der Phase IV der Sporulation in der Nomenklatur von B. subtilis urn eines der 
Gene spolVA, spolVB, spolVCA, spolVCB, spolVFA, spolVFB oder yqfD 
beziehungsweise urn ein hierzu homologes Gen handelt, vorzugsweise im Fall von 
B. subtilis urn das Gen yqfD, im Fall von Bacillus licheniformis urn das Gen spolV und 
in jedem anderen Fall urn ein hierzu homologes Gen. 

22. Grampositives Bakterium nach Anspruch 20 oder 21, wobei genau ein Gen aus der 
Phase IV der Sporulation funktionell inaktiviert ist. 
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23. Grampositives Bakterium nach Anspruch 21 oder 22, wobei die funktionelle 
Inaktivierung der Gene spoIVA, spolVB, spolVCA, spolVCB, spolVFA, spolVFB, yqfD 
oder spolV beziehungsweise den hierzu jeweils homologen Genen mithilfe der 
Sequenzen SEQ ID NO. 3, 5, 7, 9, 11, 13, 15, oder 17 oder Teilen davon erfolgt ist, 
vorzugsweise mithilfe von Teilen, die mindestens 70 bis 150 zusammenhangende 
Nukleinsaurepositionen umfassen, besonders bevorzugt mithilfe von zwei solchen 
Teilen, die einen dazwischenliegenden Teil des Gens umschliellen. 

24. Grampositives Bakterium nach einem der Anspruche 17 bis 23, wobei es sich urn 
eines der Gattungen Clostridium oder Bacillus handelt, insbesondere urn eines der 
Spezies Bacillus subtilis, B. licheniformis, B. amyloliquefaciens, B. stearothermophilus, 
B. globigii, B. clausii oder B. lentus, und ganz besonders um einen Stamm von 

B. licheniformis. 

25. Verfahren zur Fermentation eines grampositiven Bakteriums nach einem der 
Anspruche 17 bis 24. 

26. Verfahren nach Anspruch 25 zur Herstellung eines Wertstoffs, insbesondere einer 
niedermolekularen Verbindung oder eines Proteins. 

27. Verfahren nach Anspruch 26, wobei es sich bei der niedermolekularen Verbindung um 
einen Naturstoff, einen Nahrungsmittelerganzungsstoff oder um eine pharmazeutisch 
relevante Verbindung handelt. 

28. Verfahren nach Anspruch 26, wobei es sich bei dem Protein um ein Enzym handelt, 
insbesondere eines aus der Gruppe der a-Amylasen, Proteasen, Cellulasen, Lipasen, 
Oxidoreduktasen, Peroxidasen, Laccasen, Oxidasen und Hemicellulasen. 

29. Verwendung des Faktors RecA nach einem der Anspruche 1 bis 4 in einem 
molekularbiologischen Reaktionsansatz. 

30. Verwendung nach Anspruch 29 zum Stabilisieren einzelstrangiger DNA, insbesondere 
bei einer DNA-Polymerisation, bei in vitro erfolgenden Rekombinationsvorgangen, 
oder zum Oberfuhren doppelstrangiger DNA in einzelstrangige DNA oder umgekehrt. 
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31. Vektor, enthaltend eine Nukleinsaure nach einem der Anspriiche 5 bis 7. 

32. Vektor nach Anspruch 31, wobei es sich um einen Expressionsvektor handelt. 

33. Verfahren zur Herstellung eines Faktors RecA nach einem der AnsprQche 1 bis 4. 

34. Verfahren nach Anspruch 33, unter Einsatz einer Nukleinsaure nach einem der 
Anspriiche 5 bis 7, vorzugsweise eines Expressionsvektors nach Anspruch 32, weiter 
bevorzugt durch Fermentation eines diese Nukleinsaure beziehungsweise diesen 
Expressionsvektor enthaltenden Wirts. 

35. Verwendung der fur einen Faktor RecA codierenden Nukleinsaure zur Expression 
dieses Faktors. 

36. Verwendung nach Anspruch 35, um diesen Faktor selbst herzustellen, insbesondere 
in einem Verfahren nach Anspruch 34, oder um molekularbiologische Aktivitaten der 
betreffenden Zellen zu modulieren, insbesondere bei in vivo erfolgenden 
Rekombinationsvorgangen. 

37. Verwendung der fur einen Faktor RecA codierenden Nukleinsaure nach einem der 
Anspriiche 5 bis 7 zur Inaktivierung dieses Faktors oder des Gens recA in einem in 
vitro-Ansatz, insbesondere uber Wechselwirkung mit einer zugehorigen Nukleinsaure. 
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Figur 1 



1 



1 50 



MSDRQAALDM ALKQIEKQFG KGSIMKLGEQ UEURISUVPS GSLALDAALG 

2 MSDRQAALDM ALKQIEKQFG KGSIMKLGEK TDTRISTVPS GSLALDTALG 

3 MSDRQAALDM ALKQIEKQFG KGSIMKLGEK TDTRISTVPS GSLALDTALG 

4 MSDRQAALDM ALKQIEKQFG KGSIMKLGEK TDTRISTVPS GSLALDTALG 

51 100 

1 VGGYPRGRII EVYGPESSGK UUVALHAIAE VQQQGGQAAF I DADUAL D P V 

2 IGGYPRGRII EVYGPESSGK TTVALHAIAE VQEKGGQAAF IDAEHALDPV 

3 IGGYPRGRII EVYGPESSGK TTVALHAIAE VQQQR.TSAF IDAEHALDPV 

4 IGGYPRGRII EVYGPESSGK TTVALHAIAE VQQQR.TSAF IDAEHALDPV 

, 101 150 

1 YAQKLGVNID ELLLSQPDUG EQALEIAEAL VRSGAVDIW IDSVAALVPK 

2 YAQKLGVNIE ELLLSQPDTG EQALEIAEAL VRSGAVDIW VDSVAALVPK 

3 YAQKLGVNIE ELLLSQPDTG EQALEIAEAL VRSGAVDIW VDSVAALVPK 

4 YAQKLGVNIE ELLLSQPDTG EQALEIAEAL VRSGAVDIW VDSVAALVPK 

151 200 

1 AEIEGDMGDS HVGLQARLMS QALRKLSGAI NKSKUIAIFI NQIREKVGVM 

2 AEIEGDMGDS HVGLQARLMS QALRKLSGAI NKSKTIAIFI NQIREKVGVM 

3 AEIEGDMGDS HVGLQARLMS QALRKLSGAI NKSKTIAIFI NQIREKVGVM 

4 AEIEGDMGDS HVGLQARLMS QALRKLSGAI NKSKTIAIFI NQIREKVGVM 

201 250 

1 FGNPEUUPGG RALKFYSSVR LEVRRAEQLK QGNDVMGNKU KIKVVKNKVA 

2 FGNPETTPGG RALKFYSSVR LEVRRAEQLK QGNDVMGNKT RIKVVKNKVA 

3 FGNPETTPGG RALKFYSSVR LEVRRAEQLK QGNDVMGNKT KIKVVKNKVA 

4 FGNPETTPGG RALKFYSSVR LEVRRAEQLK QGNDVMGNKT KIKVVKNKVA 

251 300 

1 PPFRUAEVDI MYGEGISKEG EIIDLGUELD IVQKSGAWYS YQEERLGQGR 

2 PPFRTAEVDI MYGEGISKEG EIIDLGTELD IVQKSGSWYS YEEERLGQGR 

3 PPFRTAEVDI MYGEGISKEG EIIDLGTELD IVQKSGSWYS YEEERLGQGR 

4 PPFRTAEVDI MYGEGISKEG EIIDLGTELD IVQKSGSWYS YEEERLGQGR 

301 350 

1 ENAKQFLKEN KDILLMIQEQ IREHYGLDUG GAAPAQEDEA QAQEELEF. S 

2 ENAKQFLKEN KDIMLMIQEQ IREHYGLDNN G...VTEKAE EVQEELEFEE 

3 ENAKQFLKEN KDIMLMIQEQ IREHYGLDNN G..VVQQQAE ETQEELEFEE 

4 ENAKQFLKEN KDIMLMIQEQ IREHYGLDNN G..WQQQAE ETQEELEFEE 
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Figur 2 / Teil I 



1 50 

1 ATGAGTGATC GTCAGGCAGC CTTAGATATG GCGCTTAAAC AAATAGAAAA 

2 ATGAGTGATC GTCAGGCAGC CTTAGATATG GCTCTTAAGC AAATAGAAAA 

3 ATGAGTGATC GTCAGGCAGC CTTAGATATG GCTCTTAAAC AAATAGAAAA 

4 ATGAGTGATC GTCAGGCAGC CTTAGATATG GCTCTTAAAC AAATAGAAAA 

„ 51 100 

1 GCAGTTTGGT AAAGGTTCGA TTATGAAACT CGGCGAACAA ACT G AAAC GA 

2 ACAATTCGGC AAAGGTTCCA TCATGAAGCT CGGAGAAAAA ACGGATACAA 

3 ACAGTTCGGC AAAGGTTCCA TTATGAAACT GGGAGAAAAG ACAGATACAA 

4 ACAGTTCGGC AAAGGTTCCA TTATGAAACT GGGAGAAAAG ACAGATACAA 

, 101 150 

1 GAATTTCAAC AGTTCCGAGC GGTTCTTTAG CGCTCGATGC GGCTCTTGGA 

2 GAATTTCAAC GGTGCCGAGC GGTTCCCTTG C AC T T GAT AC CGCTCTCGGA 

3 GAATTTCTAC TGTACCAAGC GGCTCCCTCG CTCTTGATAC AGCACTGGGA 

4 GAATTTCTAC TGTACCAAGC GGCTCCCTCG CTCTTGATAC AGCACTGGGA 

151 200 

1 GTGGGCGGAT ACCCGCGCGG CCGGATTATT GAAGTATACG GGCCTGAAAG 

2 ATAGGCGGAT ACCCGCGCGG ACGGATTATT GAAGTATACG GACCTGAAAG 

3 ATTGGCGGAT ATCCTCGCGG ACGGATTATT GAAGTATACG GTCCTGAAAG 

4 ATTGGCGGAT ATCCTCGCGG ACGGATTATT GAAGTATACG GTCCTGAAAG 

201 250 

1 CTCCGGTAAA ACGACGGTGG CGCTTCATGC GATTGCCGAA GTTCAGCAGC 

2 CTCAGGTAAA ACGACTGTAG CGCTTCACGC AATCGCTGAG GTTCAGGAAA 

3 CTCAGGTAAA ACAACTGTGG CGCTTCATGC GATTGCTGAA GTTCAGCAGC 

4 CTCAGGTAAA ACAACTGTGG CGCTTCATGC GATTGCTGAA GTTCAGCAGC 

251 300 

1 AGGGCGGACA AGCGGCGTTC ATCGACGCCG ACACCGCGCT TGATCCCGTC 

2 AAGGCGGACA GGCAGCATTT ATTGATGCCG AGCATGCTCT TGATCCTGTG 

3 A . . GCGGACA AGC.GCGTTT ATCGATGCGG AGCATGCGTT AGATCCGGTA 

4 A.. GCGGACA AGC.GCGTTT ATCGATGCGG AGCATGCGTT AGATCCGGTA 

301 350 

1 TAT GC AC AAA AGCTGGGCGT CAACATTGAT GAGCTTTTGC TGTCACAGCC 

2 TACGCGCAAA AGCTCGGTGT CAATATCGAA GAGCTGCTGC TTTCTCAGCC 

3 TACGCGCAAA AGCTCGGTGT TAACATCGAA GAGCTTTTAC TGTCTCAGCC 

4 TACGCGCAAA AGCTCGGTGT TAACATCGAA GAGCTTTTAC TGTCTCAGCC 
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Figur 2 / Teil II 



351 400 

1 TGATACGGGC GAGCAGGCGC TCGAAATCGC TGAAGCCCTT GTCAGAAGCG 

2 GGATACGGGA GAGCAGGCGC TGGAGATTGC TGAAGCGCTG GTGCGAAGCG 

3 T G AC AC AGGC GAGCAGGCGC TTGAAATTGC GGAAGCATTG GTTCGAAGCG 

4 TGACACAGGC GAGCAGGCGC TTGAAATTGC GGAAGCATTG GTTCGAAGCG 

401 450 

1 GAGCGGTGGA TATCGTTGTC ATCGACTCTG TAGCAGCGCT TGTGCCGAAA 

2 GAGCTGTCGA TATCGTAGTC GTTGACTCTG TTGCGGCGCT TGTTCCAAAA 

3 GGGCAGTTGA CATTGTCGTT GTCGACTCTG TAGCCGCTCT CGTTCCGAAA 

4 GGGCAGTTGA CATTGTCGTT GTCGACTCTG TAGCCGCTCT CGTTCCGAAA 

451 500 

1 GCTGAAATCG AAGGAGATAT GGGGGATTCC CACGTCGGTT TGCAGGCCAG 

2 GCTGAAATTG AAGGTGACAT GGGTGATTCA CACGTCGGTT TACAGGCGCG 

3 GCGGAAATTG AAGGCGACAT GGGAGATTCG CATGTCGGTT TACAAGCACG 

4 GCGGAAATTG AAGGCGACAT GGGAGATTCG CATGTCGGTT TACAAGCACG 

501 550 

1 ACTGATGTCT CAGGCGCTTC GCAAGCTTTC CGGAGCGATC AATAAATCGA 

2 TCTCATGTCT CAGGCGCTCC GTAAGCTTTC CGGCGCCATC AATAAATCTA 

3 CTTAATGTCT CAAGCGCTTC GTAAGCTTTC AGGGGCCATT AACAAATCGA 

4 CTTAATGTCT CAAGCGCTTC GTAAGCTTTC AGGGGCCATT AACAAATCGA 

551 600 

1 AGACCATCGC GATCTTTATC AACCAGATTC GTGAAAAAGT CGGTGTCATG 

2 AAACAATCGC AATCTTTATT AACCAGATTC GTGAAAAAGT CGGCGTTATG 

3 AGACAATCGC GATTTTCATT AACCAAATTC GTGAAAAAGT CGGTGTTATG 

4 AGACAATCGC GATTTTCATT AACCAAATTC GTGAAAAAGT CGGTGTTATG 

601 650 

1 TTTGGAAATC CTGAGACGAC GCCAGGCGGA AGAGCGCTGA AATTCTACTC 

2 TTCGGAAATC C G GAG AC G AC ACCGGGCGGC CGCGCGCTGA AATTCTATTC 

3 TTCGGGAACC CGGAAACAAC ACCTGGCGGC CGTGCGTTGA AATTCTATTC 

4 TTCGGGAACC CGGAAACAAC ACCTGGCGGC CGTGCGTTGA AATTCTATTC 

651 700 

1 TTCTGTCCGC CTTGAAGTGC GCCGCGCAGA GCAGCTGAAA CAAGGCAACG 

2 TTCCGTGCGT CTTGAAGTGC GCCGTGCCGA GCAATTAAAG CAGGGCAACG 

3 TTCCGTGCGT CTTGAAGTGC GCCGTGCTGA ACAGCTGAAA CAAGGCAACG 

4 TTCCGTGCGT CTTGAAGTGC GCCGTGCTGA ACAGCTGAAA CAAGGCAACG 
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Figur2/Teil III 

701 750 

1 ACGTCATGGG GAACAAGACG AAAATCAAAG TCGTGAAAAA CAAAGTGGCA 

2 ACGTTATGGG GAATAAAACG AGAATTAAAG TCGTAAAAAA CAAAGTCGCT 

3 ACGTAATGGG GAACAAAACG AAAATCAAAG TCGTGAAAAA CAAGGTGGCT 

4 ACGTAATGGG GAACAAAACG AAAATCAAAG TCGTGAAAAA CAAGGTGGCT 



751 800 

1 CCTCCATTCC GGACAGCCGA AGTGGACATT ATGTACGGGG AAGGAATTTC 

2 CCTCCGTTCC GTACGGCTGA AGTGGACATT ATGTACGGTG AAGGAATCTC 

3 CCGCCGTTCC GTACAGCCGA GGTTGACATT ATGTACGGAG AAGGCATTTC 

4 CCGCCGTTCC GTACAGCCGA GGTTGACATT ATGTACGGAG AAGGCATTTC 



801 850 

1 AAAAGAAGGG GAAATCATCG ACCTCGGAAC AGAGCTTGAC ATCGTTCAAA 

2 CAAAGAAGGG GAAATCATCG ACCTTGGAAC TGAACTTGAT ATCGTGCAGA 

3 AAAAGAAGGC GAAATCATTG ATCTAGGAAC TGAACTTGAT ATCGTGCAAA 

4 AAAAGAAGGC GAAATCATTG ATCTAGGAAC TGAACTTGAT ATCGTGCAAA 



851 900 

1 AGAGCGGTGC ATGGTACTCT TATCAGGAGG AACGCCTTGG ACAAGGCCGT 

2 AAAGCGGCTC GTGGTATTCT TAT G AAGAAG AACGCCTCGG ACAGGGCCGT 

3 AAAGCGGTTC ATGGTACTCT TAT GAAGAAG AGCGTCTTGG CCAAGGCCGT 

4 AAAGCGGTTC ATGGTACTCT TAT GAAGAAG AGCGTCTTGG CCAAGGCCGT 



901 950 

1 GAAAACGCCA AACAGTTCCT GAAAGAAAAC AAGGATATCC TTTTGATGAT 

2 GAAAACGCCA AGCAGTTCTT AAAAGAAAAT AAAGAC AT C A TGCTGATGAT 

3 GAAAATGCAA AACAATTCCT GAAAGAAAAT AAAGAT AT CA TGCTGATGAT 

4 GAAAATGCAA AACAATTCCT GAAAGAAAAT AAAGAT AT CA TGCTGATGAT 



951 1000 

1 TCAAGAGCAG ATCCGGGAGC ACTACGGTTT GGATACTGGA GGCGCTGCTC 

2 TCAAGAACAA ATCCGTGAAC ATTACGGTTT GGACAATAAC GGTGTTAC. . 

3 CCAGGAGCAA ATTCGCGAAC ATTACGGCTT GGATAATAAC GGAGTAGTGC 

4 CCAGGAGCAA ATTCGCGAAC ATTACGGCTT GGATAATAAC GGAGTAGTGC 



1001 1050 

1 CTGCACAGGA AGACGAGGCC CAAGCTCAGG AAGAACTCGA GTTTTAATCA 

2 GGA AAAAGCGGAA GAAGTTCAGG AAGAGCTTGA ATTCGAAGAA 

3 AGCA GCAAGCTGAA GAGACACAAG AAGAACTCGA ATTTGAAGAA 

4 AGCA GCAAGCTGAA GAGACACAAG AAGAACTCGA ATTTGAAGAA 



1051 

1 TGA 

2 TAA 
3 

4 TAA 



H 06291 



Zusammenfassung 

Gegenstand der vorliegenden Anmeldung ist der Faktor RecA aus Bacillus licheniformis 
DSM 13 (SEQ ID NO. 2), zusammen mit dem zugehorigen Gen recA (SEQ ID NO. 1), 
einschlieRlich verwandten Proteinen und Genen hierzu. Das Gen recA wird 
erfindungsgemaft unter anderem zur Konstruktion von grampositiven bakteriellen 
Sicherheitsstammen fur die biotechnologische Produktion eingesetzt, indem es in den 
bet'reffenden Stammen inaktiviert wird. Diese weisen, sofern sie naturlicherweise zur 
Sporulation befahigt sind, in einer speziellen Ausfuhrungsform zusatzliche funktionelle 
Deletionen in Phase-IV-Sporulationsgenen auf, vorzugsweise im Gen spolV (bei Bacillus 
licheniformis), im Gen yqfD (bei B. subtilis) beziehungsweise in dem hierzu jeweils 
homologen Gen. Des weiteren steht mit diesem RecA ein Protein zur VerfQgung, das in 
molekularbiologischen Ansatzen oder zur Modulation der molekularbiologischen 
Aktivitaten von Zellen gebraucht werden kann, insbesondere im Zusammenhang mit 
DNA-Polymerisations- oder Rekombinationsvorgangen. 
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SEQUENZPROTOKOLL 

<110> Henkel Kommanditgesellschaf t auf Aktien 

<120> Der Faktor RecA aus Bacillus lichenif ormis und 
recA-inaktivierte Sicherheit ss tamme fur die 
biotechnologische Produktion 

<130> H 06291 DE 

<140> 
<141> 

<160> 18 

<170> Patentln Ver. 2.1 

<210> 1 

<211> 1047 

<212> DNA 

<213> Bacillus lichenif ormis DSM 13 

<220> 
<221> CDS 
<222> (1) . . (1047) 

<220> 

<221> gene 

<222> (1) . . (1047) 

<223> recA 

<400> 1 

atg agt gat cgt cag gca 
Met Ser Asp Arg Gin Ala 
1 5 

aag cag ttt ggt aaa ggt 
Lys Gin Phe Gly Lys Gly 
20 

acg aga att tea aca gtt 
Thr Arg lie Ser Thr Val 
35 

ctt gga gtg ggc gga tac 
Leu Gly Val Gly Gly Tyr 
50 

cct gaa age tec ggt aaa 
Pro Glu Ser Ser Gly Lys 
65 70 

gtt cag cag cag ggc gga 
Val Gin Gin Gin Gly Gly 
85 

ctt gat ccc gtc tat gca 
Leu Asp Pro Val Tyr Ala 
100 



gec tta gat atg gcg ctt aaa caa ata gaa 4 8 
Ala Leu Asp Met Ala Leu Lys Gin lie Glu 
10 ^ 15 

teg att atg aaa etc ggc gaa caa act gaa 96 
Ser lie Met Lys Leu Gly Glu Gin Thr Glu 
25 30 

ccg age ggt tct tta gcg etc gat gcg get 14 4 
Pro Ser Gly Ser Leu Ala Leu Asp Ala Ala 
40 45 

ccg cgc ggc egg att att gaa gta tac ggg 192 
Pro Arg Gly Arg lie lie Glu Val Tyr Gly 
55 60 

acg acg gtg gcg ctt cat gcg att gec gaa 24 0 
Thr Thr Val Ala Leu His Ala lie Ala Glu 
75 80 

caa gcg gcg ttc ate gac gec gac acc gcg 288 
Gin Ala Ala Phe lie Asp Ala Asp Thr Ala 
90 95 

caa aag ctg ggc gtc aac att gat gag ctt 336 
Gin Lys Leu Gly Val Asn lie Asp Glu Leu 
105 110 
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ttg ctg tea cag cct gat acg ggc gag cag gcg etc gaa ate get gaa 384 
Leu Leu Ser Gin Pro Asp Thr Gly Glu Gin Ala Leu Glu He Ala Glu 
115 120 125 

gee ctt gtc aga age gga gcg gtg gat ate gtt gtc ate gac tct gta 432 
Ala Leu Val Arg Ser Gly Ala Val Asp He Val Val He Asp Ser Val 
130 135 140 

gca gcg ctt gtg ccg aaa get gaa ate gaa gga gat atg ggg gat tec 4 80 
Ala Ala Leu Val Pro Lys Ala Glu He Glu Gly Asp Met Gly Asp Ser 
145 150 155 ~ 160 

cac gtc ggt ttg cag gee aga ctg atg tct cag gcg ctt cgc aag ctt 528 
His Val Gly Leu Gin Ala Arg Leu Met Ser Gin Ala Leu Arg Lys Leu 
165 170 175 

tec gga gcg ate aat aaa teg aag acc ate gcg ate ttt ate aac cag 576 
Ser Gly Ala He Asn Lys Ser Lys Thr He Ala He Phe He Asn Gin 
180 185 190 

att cgt gaa aaa gtc ggt gtc atg ttt gga aat cct gag acg acg cca 624 
He Arg Glu Lys Val Gly Val Met Phe Gly Asn Pro Glu Thr Thr Pro 
195 200 205 

ggc gga aga gcg ctg aaa ttc tac tct tct gtc cgc ctt gaa gtg cgc 
Gly Gly Arg Ala Leu Lys Phe Tyr Ser Ser Val Arg Leu Glu Val Arg 
210 215 220 

cgc gca gag cag ctg aaa caa ggc aac gac gtc atg ggg aac aag acg 
Arg Ala Glu Gin Leu Lys Gin Gly Asn Asp Val Met Gly Asn Lys Thr 
225 230 235 240 

aaa ate aaa gtc gtg aaa aac aaa gtg gca cct cca ttc egg aca gee 
Lys He Lys Val Val Lys Asn Lys Val Ala Pro Pro Phe Arg Thr Ala 
245 250 255 

gaa gtg gac att atg tac ggg gaa gga att tea aaa gaa ggg gaa ate 
Glu Val Asp He Met Tyr Gly Glu Gly He Ser Lys Glu Gly Glu He 
260 265 270 

ate gac etc gga aca gag ctt gac ate gtt caa aag age ggt gca tgg 
He Asp Leu Gly Thr Glu Leu Asp He Val Gin Lys Ser Gly Ala Trp 
275 280 285 

tac tct tat cag gag gaa cgc ctt gga caa ggc cgt gaa aac gee aaa 
Tyr Ser Tyr Gin Glu Glu Arg Leu Gly Gin Gly Arg Glu Asn Ala Lys 
290 295 300 

cag ttc ctg aaa gaa aac aag gat ate ctt ttg atg att caa gag cag 
Gin Phe Leu Lys Glu Asn Lys Asp He Leu Leu Met He Gin Glu Gin 
305 310 315 320 



672 



720 



768 



816 



864 



912 



960 



ate egg gag cac tac ggt ttg gat act gga ggc get get cct gca cag 1008 
He Arg Glu His Tyr Gly Leu Asp Thr Gly Gly Ala Ala Pro Ala Gin 
325 330 335 



gaa gac gag gee caa get cag ,gaa gaa etc gag ttt taa 
Glu Asp Glu Ala Gin Ala Gin Glu Glu Leu Glu Phe 
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340 345 



<210> 2 
<211> 348 
<212> PRT 

<213> Bacillus lichenif ormis DSM 13 



<400> 2 



Met 


Ser 


Asp 


Arg 


Gin 


Ala 


Ala 


Leu 


Asp 


Met 


Ala 


Leu 


Lys 


Gin 


He 


Glu 


1 








5 










10 














Lys 


Gin 


Phe 


Glv 


Lys 


Gly 


Ser 


He 


Met 


Lys 


Leu 


Gly 


Glu 


Gin 


j. 1 li- 


V3 J- LI 








20 


























Thr 


Arg 


He 


Ser 


Thr 


Val 


Pro 


Ser 


Gly 


Ser 


Leu 


Ala 






ft 1 a 


AT a 

jri J- ct 






35 




























Leu 


Glv 


Val 


Gly 


Glv 


T vr 


Pro 


Arg 


Gly 


Arg 


He 


Tie 




v a J. 


iyr 


\3JLy 




50 










55 










fin 










Pro 


Glu 


Ser 


Ser 


Glv 

J: 


Lys 


Thr 


Thr 


Val 


Ala 


Leu 


His 


Ala 


He 


Ala 


Glu 


65 










70 










7 5 










o u 


Val 


Gin 


Gin 


Gin 


Gly 


Glv 


Gin 


Ala 


Ala 


Phe 


He 


Asp 


Ala 


Asp 


Thr 


Ala 










85 










90 














Leu 


Asp 


Pro 


Val 


T vr 


Ala 


Gin 


Lys 


Leu 


Gly 


Val 


Asn 


Tie 


Asp 


Glu 


Leu 








100 










105 










1 1 n 

-L -L VJ 






Leu 


Leu 


Ser 


Gin 


Pro 


Asp 


Thr 


Gly 


Glu 


Gin 


Ala 


Leu 


Glu 


He 


Ala 


Glu 






115 










120 










125 








Ala 


Leu 


Val 


Arg 


Ser 


Gly 


Ala 


Val 


Asp 


He 


Val 


Val 


He 


Asp 


Ser 


Val 




130 










135 










140 










Ala 


Ala 


Leu 


Val 


Pro 


Lvs 


Ala 


Glu 


He 


Glu 


Glv 

J: 


Asp 


Met 


Glv 


Asp 


Ser 


145 










150 










155 










160 


His 


Val 


Gly 


Leu 


Gin 


Ala 


Arg 


Leu 


Met 


Ser 


Gin 


Ala 


Leu 


Arg 


Lys 


Leu 










165 










170 










175 




Ser 


Gly 


Ala 


He 


Asn 


Lvs 


Ser 


Lvs 


Thr 


He 


Ala 


He 


Phe 


He 


Asn 


Gin 








180 










185 










190 






lie 


Arg 


Glu 


Lys 


Val 


Gly 


Val 


Met 


Phe 


Glv 


Asn 


Pro 


Glu 


Thr 


Thr 


Pro 






195 










200 










205 








Gly 


Gly 


Arg 


Ala 


Leu 


Lys 


Phe 


Tyr 


Ser 


Ser 


Val 


Arg 


Leu 


Glu 


Val 


Arg 




210 










215 










220 










Arg 


Ala 


Glu 


Gin 


Leu 


Lys 


Gin 


Gly 


Asn 


Asp 


Val 


Met 


Gly 


Asn 


Lys 


Thr 


225 










230 










235 










240 


Lys 


He 


Lys 


Val 


Val 


Lys 


Asn 


Lys 


Val 


Ala 


Pro 


Pro 


Phe 


Arg 


Thr 


Ala 










245 










250 










255 




Glu 


Val 


Asp 


He 


Met 


Tyr 


Gly 


Glu 


Gly 


He 


Ser 


Lys 


Glu 


Gly 


Glu 


He 








260 










265 










270 






He 


Asp 


Leu 


Gly 


Thr 


Glu 


Leu 


Asp 


He 


Val 


Gin 


Lys 


Ser 


Gly 


Ala 


Trp 






275 










280 










285 








Tyr 


Ser 


Tyr 


Gin 


Glu 


Glu 


Arg 


Leu 


Gly 


Gin 


Gly 


Arg 


Glu 


Asn 


Ala 


Lys 




290 










295 










300 










Gin 


Phe 


Leu 


Lys 


Glu 


Asn 


Lys 


Asp 


He 


Leu 


Leu 


Met 


He 


Gin 


Glu 


Gin 


305 










310 










315 










320 


He 


Arg 


Glu 


His 


Tyr 


Gly 


Leu 


Asp 


Thr 


Gly 


Gly 


Ala 


Ala 


Pro 


Ala 


Gin 










325 










330 










335 




Glu 


Asp 


Glu 


Ala 


Gin 


Ala 


Gin 


Glu 


Glu 


Leu 


Glu 


Phe 











340 345 



<210> 3 
<211> 1792 
<212> DNA 
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<213> Bacillus lichenif ormis 

<220> 

<221> CDS 

<222> (140) . . (1336) 
<220> 

<221> gene 

<222> (1) . . (1792) 

<223> spoIV 

<220> 

<221> misc_f eature 
<222> (140) . . (142) 

<223> First codon translated as Met. 
<400> 3 

ggctgatgct caaacagggg cagtgcatca ttcaaggcaa agactttgtc atcaaaacga 60 

ttttgcctga ggaaattctg cttgaaggca cgattgagct tgtccgctat atcgattcat 120 

aagtcggggg gaaagaagc gtg aag aat aaa tgg ctt tct ttt ttt tea gga 172 

Val Lys Asn Lys Trp Leu Ser Phe Phe Ser Gly 
1 5 10 

aag ate cag ctt aag ata acg gga aaa ggg ate gaa egg tta tta aat 220 
Lys lie Gin Leu Lys lie Thr Gly Lys Gly lie Glu Arg Leu Leu Asn 
15 20 25 

gaa tgc ace agg cgc aac ate ccg atg ttt aat gta aag aaa aag aaa 268 
Glu Cys Thr Arg Arg Asn lie Pro Met Phe Asn Val Lys Lys Lys Lys 
30 35 40 

gac gee gtc ttt ctt tat att ccg ctt tct gat gta cat gec ttc egg 316 
Asp Ala Val Phe Leu Tyr lie Pro Leu Ser Asp Val His Ala Phe Arg 
45 50 55 

aag gtc ate aga ggc ttc gac tgc aag tgc agg ttc ate aaa cga aaa 364 
Lys Val lie Arg Gly Phe Asp Cys Lys Cys Arg Phe He Lys Arg Lys 
60 65 70 75 

ggg ttt cct ttc etc gtg cag aag tct aaa egg aat age ggc ttc act 412 
Gly Phe Pro Phe Leu Val Gin Lys Ser Lys Arg Asn Ser Gly Phe Thr 
80 85 J 90 

ttt gga gtt get gca ttt ttt ate ate atg etc eta ttg tec aac atg 4 60 
Phe Gly Val Ala Ala Phe Phe He He Met Leu Leu Leu Ser Asn Met 
95 100 105 

ctt tgg aaa att gat att aca gga gee aat ccg gag aca gaa cat caa 508 
Leu Trp Lys lie Asp He Thr Gly Ala Asn Pro Glu Thr Glu His Gin 
HO 115 120 

ate aaa cag caa ttg gat caa ate ggc gtc aaa aaa ggc cgc ttt cag 556 
He Lys Gin Gin Leu Asp Gin He Gly Val Lys Lys Gly Arg Phe Gin 
125 130 135 

ttt tea atg ctg ace ccg gaa aaa att cag cag gcg etc aca aag egg 604 
Phe Ser Met Leu Thr Pro Glu Lys He Gin Gin Ala Leu Thr Lys Arg 
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140 145 150 155 

gtc gaa aac ate act tgg gtg ggt att gag tta aac ggc acc gec ctt 652 
Val Glu Asn lie Thr Trp Val Gly lie Glu Leu Asn Gly Thr Ala Leu 
160 165 170 

cac atg aaa gtc gtt gaa aag aat gaa cct gac aaa gaa aaa tat ate 700 
His Met Lys Val Val Glu Lys Asn Glu Pro Asp Lys Glu Lys Tyr lie 
175 180 185 

ggt ccg agg cac ate gtc gee aaa aaa ggg gcg acc ate teg aaa aag 748 
Gly Pro Arg His lie Val Ala Lys Lys Gly Ala Thr lie Ser Lys Lys 
190 195 200 

ttc gtg gaa aaa ggc gag ccg etc gtc acg gtg aac cag cac gtt gaa 796 
Phe Val Glu Lys Gly Glu Pro Leu Val Thr Val Asn Gin His Val Glu 
205 210 215 

aaa ggg caa atg etc gtt tec ggg ctg ate gga age gaa gag gaa aag 844 
Lys Gly Gin Met Leu Val Ser Gly Leu lie Gly Ser Glu Glu Glu Lys 
220 225 230 235 

caa aaa gtc gga gca aaa ggg aaa ate tac ggt gaa acc tgg tac aag 8 92 
Gin Lys Val Gly Ala Lys Gly Lys lie Tyr Gly Glu Thr Trp Tyr Lys 
240 245 " 250 

tea aca gta acg gtt cct ctt gag aca tea ttt gac gtt ttt acg ggt 940 
Ser Thr Val Thr Val Pro Leu Glu Thr Ser Phe Asp Val Phe Thr Gly 
255 2 60 2 65 

aaa gta agg aca agt cac aag eta tec etc gga tea ttt tec gtg ccg 988 
Lys Val Arg Thr Ser His Lys Leu Ser Leu Gly Ser Phe Ser Val Pro 
270 275 280 

ate tgg ggc ttt tea ttt aaa aaa gaa gac ttc teg cgc ccg aag acg 1036 
lie Trp Gly Phe Ser Phe Lys Lys Glu Asp Phe Ser Arg Pro Lys Thr 
285 290 295 

gag acc gaa aac ccc teg ctg cat ttt atg aat ttt aag ctt cct gtc 1084 
Glu Thr Glu Asn Pro Ser Leu His Phe Met Asn Phe Lys Leu Pro Val 
300 305 310 ~ 315 

get tat gaa aag gag cat atg agg gag age gaa caa ate aaa agg gtg 1132 
Ala Tyr Glu Lys Glu His Met Arg Glu Ser Glu Gin lie Lys Arg Val 
320 325 A 330 

tac teg aaa aaa gaa gca gtt ctt gaa gga ate gaa atg gga aaa aga 1180 
Tyr Ser Lys Lys Glu Ala Val Leu Glu Gly lie Glu Met Gly Lys Arg 
335 340 345 

gac ate agg aaa aaa ate ggc age gac ggg aac att ate agt gaa aaa 1228 
Asp He Arg Lys Lys He Gly Ser Asp Gly Asn He He Ser Glu Lys 
350 355 360 

gtt ttg cac gaa acg age gag aat ggc aaa gtt aaa ttg ate ate ctt 127 6 
Val Leu His Glu Thr Ser Glu Asn Gly Lys Val Lys Leu He He Leu 
365 370 375 

tac cag gtt att gaa gac att gtt caa aca aca cca att gtt cag gag 1324 
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Tyr Gin Val lie Glu Asp lie Val Gin Thr Thr Pro lie Val Gin Glu 
380 385 390 395 

act aaa gaa tga cagaacactt acttgcaatt catcagcaac tggaaagtcc 137 6 



Thr Lys Glu 












gaatgaggct 


caaacgctgt 


ttgggaacca 


ggattcccat 


ttgaagttga 


tggaggaaga 


1436 


gctgaacatt 


tcaattgtca 


cgcgcggaga 


aaccgtgtat 


gtgacaggag 


atgaagaaac 


1496 


gtttgaaatc 


gcggacagcc 


tgcttgcctc 


tctcctaaat 


ctgatccgca 


aaggaatcga 


1556 


gatatccgaa 


cgcgatgtct 


tgtatgcgat 


caagatggcg 


aaaaagcaga 


agcttgagtt 


1616 


ttttgaaagc 


atgtatgaag 


aggaaattac 


gaaaaacgcc 


aaaggaaaac 


cgatcagagt 


1676 


caaaaccatc 


ggtcaaagag 


aatacatcgc 


cgccatgaaa 


aggcacgact 


taatcttcgg 


1736 


catcggccca 


gcaggaacgg 


ggaaaaccta 


tttggctgtc 


gtaaaggccg 


ttcatg 


1792 



<210> 4 
<211> 398 
<212> PRT 

<213> Bacillus lichenif ormis 



<400> 4 






























Val 


Lys 


Asn 


Lys 


Trp 


Leu 


Ser 


Phe 


Phe 


Ser 


Gly 


Lys 


He 


Gin 


Leu 


Lys 


1 








5 










10 










15 




He 


Thr 


Gly 


Lys 


Gly 


He 


Glu 


Arg 


Leu 


Leu 


Asn 


Glu 


Cys 


Thr 


Arg 


Arg 








20 










25 










30 






Asn 


He 


Pro 


Met 


Phe 


Asn 


Val 


Lys 


Lys 


Lys 


Lys 


Asp 


Ala 


Val 


Phe 


Leu 






35 










40 










45 








Tyr 


He 


Pro 


Leu 


Ser 


Asp 


Val 


His 


Ala 


Phe 


Arg 


Lys 


Val 


He 


Arg 


Gly 




50 










55 










60 










Phe 


Asp 


Cys 


Lys 


Cys 


Arg 


Phe 


He 


Lys 


Arg 


Lys 


Gly 


Phe 


Pro 


Phe 


Leu 


65 










70 










75 










80 


Val 


Gin 


Lys 


Ser 


Lys 


Arg 


Asn 


Ser 


Gly 


Phe 


Thr 


Phe 


Gly 


Val 


Ala 


Ala 










85 










90 










95 




Phe 


Phe 


He 


He 


Met 


Leu 


Leu 


Leu 


Ser 


Asn 


Met 


Leu 


Trp 


Lys 


He 


Asp 








100 










105 










110 






He 


Thr 


Gly 


Ala 


Asn 


Pro 


Glu 


Thr 


Glu 


His 


Gin 


He 


Lys 


Gin 


Gin 


Leu 






115 










120 










125 








Asp 


Gin 


He 


Gly 


Val 


Lys 


Lys 


Gly 


Arg 


Phe 


Gin 


Phe 


Ser 


Met 


Leu 


Thr 




130 










135 










140 










Pro 


Glu 


Lys 


He 


Gin 


Gin 


Ala 


Leu 


Thr 


Lys 


Arg 


Val 


Glu 


Asn 


He 


Thr 


145 










150 










155 










160 


Trp 


Val 


Gly 


He 


Glu 


Leu 


Asn 


Gly 


Thr 


Ala 


Leu 


His 


Met 


Lys 


Val 


Val 










165 










170 










175 




Glu 


Lys 


Asn 


Glu 


Pro 


Asp 


Lys 


Glu 


Lys 


Tyr 


He 


Gly 


Pro 


Arg 


His 


He 








180 










185 










190 






Val 


Ala 


Lys 


Lys 


Gly 


Ala 


Thr 


He 


Ser 


Lys 


Lys 


Phe 


Val 


Glu 


Lys 


Gly 






195 










200 










205 








Glu 


Pro 


Leu 


Val 


Thr 


Val 


Asn 


Gin 


His 


Val 


Glu 


Lys 


Gly 


Gin 


Met 


Leu 




210 










215 










220 










Val 


Ser 


Gly 


Leu 


He 


Gly 


Ser 


Glu 


Glu 


Glu 


Lys 


Gin 


Lys 


Val 


Gly 


Ala 


225 










230 










235 










240 


Lys 


Gly 


Lys 


He 


Tyr 


Gly 


Glu 


Thr 


Trp 


Tyr 


Lys 


Ser 


Thr 


Val 


Thr 


Val 










245 










250 










255 
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Pro 


Leu 


Glu 


Thr 








260 


X1JL 5 


Lys 


Leu 


Ser 






z / o 






Lys 


Lys 


(jJ.U 




o q n 
zyu 






OCX 


Leu 


HIS 


rne 










His 




7\ f t~T 

rily 




Ala 


Val 


Leu 


Glu 








340 


He 


Gly 


Ser 


Asp 






355 




Ser 


Glu 


Asn 


Gly 




370 






Asp 


He 


Val 


Gin 



385 



Ser 


Phe 


Asp 


Val 


Leu 


Gly 


Ser 


Phe 








280 


Asp 


Phe 


Ser 


Arg 






295 




Met 


Asn 


Phe 


Lys 




310 






Ser 


Glu 


Gin 


He 


325 








Gly 


He 


Glu 


Met 


Gly Asn 


He 


He 








360 


Lys 


Val 


Lys 


Leu 






375 




Thr 


Thr 


Pro 


He 




390 







Phe Thr Gly Lys 
265 

Ser Val Pro He 

Pro Lys Thr Glu 
300 

Leu Pro Val Ala 
315 

Lys Arg Val Tyr 
330 

Gly Lys Arg Asp 
345 

Ser Glu Lys Val 

He He Leu Tyr 
380 

Val Gin Glu Thr 
395 



Val 


Arg 


Thr 


Ser 




270 






Trp 


Gly 


Phe 


Ser 


285 








Thr 


Glu 


Asn 


Pro 


Tyr 


Glu 


L ys 


Glu 








320 


Ser 


Lys 


Lys 


Glu 






335 




He 


Arg 


Lys 


Lys 




350 






Leu 


His 


Glu 


Thr 


365 








Gin 


Val 


lie 


Glu 



Lys Glu 



<210> 5 
<211> 1594 
<212> DNA 

<213> Bacillus subtilis 

<220> 
<221> CDS 

<222> (201) . . (1397) 
<220> 

<221> gene 

<222> (1) . . (1594) 

<223> yqfD 

<220> 

<221> mis cofeature 
<222> (201) . . (203) 

<223> First codon translated as Met. 
<400> 5 

gacttcatat ctacatagaa aaccacagag gccttttgct tttcagtgag aatgaagtgc 60 

ggctgatgct gaagcagggc cagtgcatca tatctggtaa aaattttgtc atcaaggcga 120 

ttcttccgga agagatactt ttggagggta cgattgatgt cgttcgatat gttgagtcat 180 

aaagccgagg gggaaatgtt gtg aaa aat aaa tgg ctg tct ttt ttt teg ggt 233 

Val Lys Asn Lys Trp Leu Ser Phe Phe Ser Gly 
1 5 io 

aag gtc cag ctt gaa ttg acg gga aga ggg att gag egg etc ctt aat 281 
Lys Val Gin Leu Glu Leu Thr Gly Arg Gly He Glu Arg Leu Leu Asn 
15 20 25 

gaa tgc aca aaa cag ggg att ccg gtc ttt cat gtc aaa aaa aag aaa 329 
Glu Cys Thr Lys Gin Gly He Pro Val Phe His Val Lys Lys Lys Lys 
30 35 40 
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gaa gcc gta teg tta tat ata cag ctt cag gat gta cat gec ttt egg 377 
Glu Ala Val Ser Leu Tyr He Gin Leu Gin Asp Val His Ala Phe Arg 
4 5 50 55 

egg gta aga agt aaa ttt aaa tgt aaa gcc cga ttt ate aat egg aag 425 
Arg Val Arg Ser Lys Phe Lys Cys Lys Ala Arg Phe He Asn Arg Lys 
60 65 70 75 

gga ttt ccc ttc ctg ttg ctg aaa tea aag, ctg aat ata ggg ttt acg 473 
Gly, Phe Pro Phe Leu Leu Leu Lys Ser Lys Leu Asn He Gly Phe Thr 
80 85 90 

ate ggt ttt gcg att ttt ttc att ctt ttg ttt ttg ctg tec aat atg 521 
lie Gly Phe Ala He Phe Phe He Leu Leu Phe Leu Leu Ser Asn Met 
95 100 105 

gtg tgg aaa att gat gtg aca ggc get aag qct gaa aca gaa cat caa 569 
Val Trp Lys He Asp Val Thr Gly Ala Lys Pro Glu Thr Glu His Gin 
110 115 120 

atg agg cag cat ctt aat gaa ate ggc gtc aaa aag ggc cgt ctg cag 617 
Met Arg Gin His Leu Asn Glu He Gly Val Lys Lys Gly Arg Leu Gin 
125 130 135 

ttt tta atg atg teg ccc gaa aaa ata cag aaa tea tta acc aat gga 665 
Phe Leu Met Met Ser Pro Glu Lys lie Gin Lys Ser Leu Thr Asn Gly 
140 145 150 155 

ata gac aat ate act tgg gtc gga gtt gat ctg aag ggg acg acc att 713 
He Asp Asn lie Thr Trp Val Gly Val Asp Leu Lys Gly Thr Thr He 
160 165 170 

cat atg aaa gtt gtg gag aaa aat gag ccc gaa aaa gaa aaa tat gtt 761 
His Met Lys Val Val Glu Lys Asn Glu Pro Glu Lys Glu Lys Tyr Val 
175 180 " 185 

age ccg cgc aat att gtc gcc aaa aag aaa gca acc att acg aga atg 809 
Ser Pro Arg Asn lie Val Ala Lys Lys Lys Ala Thr lie Thr Arg Met 
190 195 200 

tct gtg caa aaa gga cag ccc atg gcc gcc ata cac gat cat gtt gaa 857 
Ser Val Gin Lys Gly Gin Pro Met Ala Ala He His Asp His Val Glu 
205 210 215 

aag gga cag ctg ctt gtt teg gga ctg ate ggc age gaa gac cat cag 905 
Lys Gly Gin Leu Leu Val Ser Gly Leu He Gly Ser Glu Asp His Gin 
220 225 230 " 235 

cag gaa gtc gcc tea aaa gca gaa att tat gga gaa acc tgg tat aga 953 
Gin Glu Val Ala Ser Lys Ala Glu He Tyr Gly Glu Thr Trp Tyr Arg 
240 245 " 250 

tea gaa gtg aca gtc ccg ctt gaa aca tta ttt aac gtc tat acg ggc 1001 
Ser Glu Val Thr Val Pro Leu Glu Thr Leu Phe Asn Val Tyr Thr Gly 
255 260 265 

aaa gta agg aca aag cac aag ctt tct ttt ggt tct ttg gca ate ccg 104 9 
Lys Val Arg Thr Lys His Lys Leu Ser Phe Gly Ser Leu Ala He Pro 
270 275 280 
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ate tgg ggg atg acg ttt aaa aaa gag gaa ttg aag cat cca aaa aca 1097 

lie Trp Gly Met Thr Phe Lys Lys Glu Glu Leu Lys His Pro Lys Thr 

285 290 295 

gaa caa gaa aag cat teg ctt cat ttt etc gga ttt aag etc cct gta 1145 

Glu Gin Glu Lys His Ser Leu His Phe Leu Gly Phe Lys Leu Pro Val 

300 305 310 " 315 

tec tat gtc aaa gag caa acg aga gaa agt gaa gag get ttg cga aaa 1193 

Ser Tyr Val Lys Glu Gin Thr Arg Glu Ser Glu Glu Ala Leu Arg Lys 

320 325 330 

tat aca aaa gaa gaa gca gtt caa gaa ggc att aaa ttg ggt aaa cag 1241 

Tyr Thr Lys Glu Glu Ala Val Gin Glu Gly lie Lys Leu Gly Lys Gin 

335 340 "* ' 345 

gat gta gag gat aaa ata ggc gaa aac ggc gag gtg aaa agt gaa aaa 128 9 

Asp Val Glu Asp Lys lie Gly Glu Asn Gly Glu Val Lys Ser Glu Lys 

350 355 360 

gtt ttg cac cag act gtt gag aat ggt aaa gta aag ttg att att etc 1337 

Val Leu His Gin Thr Val Glu Asn Gly Lys Val Lys Leu lie lie Leu 

365 370 375 

tac caa gtt ata gaa gat ate gtt caa ace aca cct att gtc agg gag 1385 

Tyr Gin Val lie Glu Asp He Val Gin Thr Thr Pro He Val Arg Glu 

380 385 390 395 

act gaa gaa tga cagaacattt acttgegatg aatcaaaaac tgaaaaaccc 1437 
Thr Glu Glu 

ggacgaggcg ctttcactct tegggaacca agattctttt ttgaaattga tggagaaaga 14 97 

tctgaattta aatatcatta cgcgcggcga gacgatttat gtttcaggcg atgatgaatc 1557 

gtttcagatt gcagacaggc tgctgggatc gctcctc 1594 



<210> 6 
<211> 398 
<212> PRT 

<213> Bacillus subtilis 



<400> 6 



Val 


Lys 


Asn 


Lys 


Trp 


Leu 


Ser 


Phe 


Phe 


Ser 


Gly Lys 


Val 


Gin 


Leu 


Glu 


1 








5 










10 










15 




Leu 


Thr 


Gly 


Arg 
20 


Gly 


He 


Glu 


Arg 


Leu 
25 


Leu 


Asn 


Glu 


Cys 


Thr 
30 


Lys 


Gin 


Gly 


He 


Pro 
35 


Val 


Phe 


His 


Val 


Lys 
40 


Lys 


Lys 


Lys 


Glu 


Ala 
45 


Val 


Ser 


Leu 


Tyr 


He 


Gin 


Leu 


Gin 


Asp 


Val 


His 


Ala 


Phe 


Arg 


Arg 


Val 


Arg 


Ser 


Lys 




50 










55 










60 








Phe 


Lys 


Cys 


Lys 


Ala 


Arg 


Phe 


He 


Asn 


Arg 


Lys 


Gly 


Phe 


Pro 


Phe 


Leu 


65 










70 










75 










80 


Leu 


Leu 


Lys 


Ser 


Lys 
85 


Leu 


Asn 


He 


Gly 


Phe 
90 


Thr 


He 


Gly 


Phe 


Ala 
95 


He 


Phe 


Phe 


He 


Leu 


Leu 


Phe 


Leu 


Leu 


Ser 


Asn 


Met 


Val 


Trp 


Lys 


He 


Asp 








100 










105 










110 
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Val Thr Gly Ala 
115 

Asn Glu lie Gly 
130 

Pro Glu Lys lie 
145 

Trp Val Gly Val 

Glu Lys Asn Glu 
180 

Val Ala Lys Lys 
195 

Gin Pro Met Ala 
210 

Val Ser Gly Leu 

225 

Lys Ala Glu lie 

Pro Leu Glu Thr 
260 

His Lys Leu Ser 
275 

Phe Lys Lys Glu 

2 90 

Ser Leu His Phe 
305 

Gin Thr Arg Glu 

Ala Val Gin Glu 
340 

lie Gly Glu Asn 
355 

Val Glu Asn Gly 
370 

Asp lie Val Gin 
385 



Lys 


Pro 


Glu 


Thr 








120 


Val 


Lys 


Lys 


Gly 






135 




Gin 


Lvs 


Ser 


Leu 




150 






Asp 


Leu 


Lvs 


Gly 


165 








Pro 


Glu 


Lys 


Glu 


Lys 


Ala 


Thr 


lie 








200 


Ala 


He 


His 


Asp 






215 




lie 


Gly 


Ser 


Glu 




230 






Tyr 


Gly 


Glu 


Thr 


245 








Leu 


Phe 


Asn 


Val 


Phe 


Gly 


Ser 


Leu 








280 


Glu 


Leu 


Lys 


His 






295 




Leu 


Gly 


Phe 


Lvs 




310 






Ser 


Glu 


Glu 


Ala 


325 








Gly 


He 


Lys 


Leu 


Gly 


Glu 


Val 


Lys 








360 


Lys 


Val 


Lys 


Leu 






375 




Thr 


Thr 


Pro 


He 




390 







Glu 


His 


Gin 


Met 


Arg 


Leu 


Gin 


Phe 








140 


Thr 


Asn 


Gly 


He 






155 




Thr 


Thr 


He 


His 




170 






Lys 


Tyr 


Val 


Ser 


185 








Thr 


Arg 


Met 


Ser 


His 


Val 


Glu 


Lys 








220 


Asp 


His 


Gin 


Gin 






235 




Trp 


Tyr 


Arg 


Ser 




250 






Tyr 


Thr 


Gly 


Lvs 


265 








Ala 


He 


Pro 


lie 


Pro 


Lys 


Thr 


Glu 








300 


Leu 


Pro 


Val 


Ser 






315 




Leu 


Arg 


Lys 


Tvr 

x Jr J - 




330 






Gly Lys 


Gin 


Asp 


345 








Ser 


Glu 


Lys 


Val 


He 


He 


Leu 


Tyr 








380 


Val 


Arg 


Glu 


Thr 






395 





Arg 


Gin 


His 


Leu 


125 








Leu 


Met 


Met 


Ser 


Asp 


Asn 


He 


Thr 








160 


Met 


Lvs 


Val 


Val 






175 




Pro 


Arg 


Asn 


He 




190 






Val 


Gin 


Lys 


Gly 


205 








Gly 


Gin 


Leu 


Leu 


Glu 


Val 


Ala 


Ser 








240 


Glu 


Val 


Thr 


Val 






255 




Val 


Arg 


Thr 


Lvs 




270 






Trp 


Gly 


Met 


Thr 


285 








Gin 


Glu 


Lvs 


His 


Tyr 


Val 


Lys 


Glu 








320 


Thr 


Lys 


Glu 


Glu 






335 




Val 


Glu 


Asp 


Lys 




350 






Leu 


His 


Gin 


Thr 


365 








Gin 


Val 


He 


Glu 



Glu Glu 



<210> 7 
<211> 1876 
<212> DNA 

<213> Bacillus subtilis 

<220> 
<221> CDS 

<222> (201) . . (1679) 
<220> 

<221> gene 

<222> (1) . . (1876) 

<223> spoIVA 

<220> 

<221> mis cofeature 
<222> (201) . . (203) 

<223> First codon translated as Met. 
<400> 7 
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atgatatgaa aaaggaatga acctttctcc cttgcataca aatagggaga aaggtttttt 60 

tatattaata gattgaggat gagaaatttt ctaaagatgt catattcaaa taggacaacg 120 

tcatacacat atagtgtcct gtgtttgatt gaaagagctt aataaaattg aaaaggatag 180 

gaagtccggg aggggatcac ttg gaa aag gtc gat att ttc aag gat ate get 233 

Leu Glu Lys Val Asp He Phe Lys Asp He Ala 
1 5 io 

gaa cga aca gga ggc gat ata tac tta gga gtc gta ggt get gtc cgt 281 
Glu Arg Thr Gly Gly Asp He Tyr Leu Gly Val Val Gly Ala Val Arc 
15 20 25 

aca gga aaa tec acg ttc att aaa aaa ttt atg gag ctt gtg gtg etc 329 
Thr Gly Lys Ser Thr Phe He Lys Lys Phe Met Glu Leu Val Val Leu 
30 35 40 

ccg aat ate agt aac gaa gca gac egg gee cga gcg cag gat gaa ctg 377 
Pro Asn He Ser Asn Glu Ala Asp Arg Ala Arg Ala Gin Asp Glu Leu 
45 50 55 

ccg cag age gca gee ggc aaa ace att atg act aca gag cct aaa ttt 425 
Pro Gin Ser Ala Ala Gly Lys Thr He Met Thr Thr Glu Pro Lys Phe 
60 65 70 75 

gtt ccg aat cag gcg atg tct gtt cat gtg tea gac gga etc gat gtg 473 
Val Pro Asn Gin Ala Met Ser Val His Val Ser Asp Gly Leu Asp Val 
80 85 90 

aat ata aga tta gta gat tgt gta ggt tac aca gtg ccc ggc get aaa 521 
Asn He Arg Leu Val Asp Cys Val Gly Tyr Thr Val Pro Gly Ala Lys 
95 100 105 

gga tat gaa gat gaa aac ggg ccg egg atg ate aat acg cct tgg tac 569 
Gly Tyr Glu Asp Glu Asn Gly Pro Arg Met He Asn Thr Pro Trp Tvr 
HO 115 120 

gaa gaa ccg ate cca ttt cat gag get get gaa ate ggc aca cga aaa 617 
Glu Glu Pro He Pro Phe His Glu Ala Ala Glu He Gly Thr Arg Lys 
125 130 135 

gtc att caa gaa cac teg acc ate gga gtt gtc att acg aca gac ggc 665 
Val He Gin Glu His Ser Thr He Gly Val Val He Thr Thr Asp Glv 
14 ° 145 ~ 150 155 

acc att gga gat ate gec aga agt gac tat ata gag get gaa gaa aga 713 
Thr He Gly Asp He Ala Arg Ser Asp Tyr He Glu Ala Glu Glu Arg 
160 165 170 

gtc att gaa gag ctg aaa gag gtt ggc aaa cct ttt att atg gtc ate 7 61 
Val He Glu Glu Leu Lys Glu Val Gly Lys Pro Phe He Met Val He 
175 180 185 

aac tea gtc agg ccg tat cac ccg gaa acg gaa gec atg cgc cag gat 809 
Asn Ser Val Arg Pro Tyr His Pro Glu Thr Glu Ala Met Arg Gin Asp 
190 195 200 

tta age gaa aaa tat gat ate ccg gta ttg gca atg agt gta gag age 857 
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Leu Ser Glu Lys Tyr Asp He Pro Val Leu Ala Met Ser Val Glu Ser 
205 210 215 

atg egg gaa tea gat gtg ctg agt gtg etc aga gag gec etc tac gag 
Met Arg Glu Ser Asp Val Leu Ser Val Leu Arg Glu Ala Leu Tyr Glu 
220 225 230 235 

ttt ccg gtg eta gaa gtg aat gtc aat etc cca age tgg gta atg gtg 
Phe Pro Val Leu Glu Val Asn Val Asn Leu Pro Ser Trp Val Met Val 
240 245 250 

ctg aaa gaa aac cat tgg ttg cgt gaa age tat cag gag tec gtg aag 
Leu Lys Glu Asn His Trp Leu Arg Glu Ser Tyr Gin Glu Ser Val Lys 
255 260 265 



ggc caa ttc age gag ttt gaa ttc att gaa agt gee gga tta gee gga 
Gly Gin Phe Ser Glu Phe Glu Phe He Glu Ser Ala Gly Leu Ala Gly 
285 290 • 295 



tta atg cag gac ttt gag gat gat ccg etc tec ate tgg aat tec gat 
Leu Met Gin Asp Phe Glu Asp Asp Pro Leu Ser He Trp Asn Ser Asp 
430 435 440 



905 



953 



1001 



gaa acg gtt aag gat att aaa egg etc egg gac gta gac agg gtt gtc 104 9 
Glu Thr Val Lys Asp He Lys Arg Leu Arg Asp Val Asp Arg Val Val 
270 275 280 



1097 



att gag ctg ggc caa ggg gtg gca gaa att gat ttg tac gcg cct gat 1145 
He Glu Leu Gly Gin Gly Val Ala Glu He Asp Leu Tyr Ala Pro Asp 

300 305 310 315 

cat eta tat gat caa ate eta aaa gaa gtt gtg ggc gtc gaa ate aga 1193 

His Leu Tyr Asp Gin He Leu Lys Glu Val Val Gly Val Glu He Arg 
320 325 330 

gga aga gac cat ctg ctt gag etc atg caa gac ttc gee cat gcg aaa 1241 

Gly Arg Asp His Leu Leu Glu Leu Met Gin Asp Phe Ala His Ala Lys 

335 340 345 

aca gaa tat gat caa gtg tct gat gee tta aaa atg gtc aaa cag acg 128 9 

Thr Glu Tyr Asp Gin Val Ser Asp Ala Leu Lys Met Val Lys Gin Thr 
350 355 360 

gga tac ggc att gca gcg cct get tta get gat atg agt etc gat gag 1337 

Gly Tyr Gly He Ala Ala Pro Ala Leu Ala Asp Met Ser Leu Asp Glu 
365 370 375 

ccg gaa att ata agg cag ggc teg cga ttc ggt gtg agg ctg aaa get 1385 

Pro Glu He He Arg Gin Gly Ser Arg Phe Gly Val Arg Leu Lys Ala 

380 385 390 " 395 

gtc get ccg teg ate cat atg ate aaa gta gat gtc gaa age gaa ttc 1433 

Val Ala Pro Ser He His Met He Lys Val Asp Val Glu Ser Glu Phe 
400 405 410 

gee ccg att ate gga acg gaa aaa caa agt gaa gag ctt gta cgc tat 1481 

Ala Pro He He Gly Thr Glu Lys Gin Ser Glu Glu Leu Val Arg Tyr 

415 420 425 



1529 
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ate ttc gga agg teg ctg age tea att gtg aga gaa ggg att cag gca 1577 
lie Phe Gly Arg Ser Leu Ser Ser lie Val Arg Glu Gly lie Gin Ala 
445 450 455 

aag ctg tea ttg atg cct gaa aac gca egg tat aaa tta aaa gaa aca 1625 
Lys Leu Ser Leu Met Pro Glu Asn Ala Arg Tyr Lys Leu Lys Glu Thr 
460 465 470 ~ " 475 

tta gaa aga ate ata aac gaa ggc tct ggc ggc tta ate gee ate ate 1673 
Leu Glu Arg lie lie Asn Glu Gly Ser Gly Gly Leu lie Ala lie lie 
480 485 490 

ctg taa taceggtaga cctctttata gaatgggagg tcttttttct ttgctcttaa 1729 
Leu 

taatggaaaa ggatcaagga ataggatgaa aaaaggaaaa aaaggaatat tcgttcggta 1789 
aatcacctta aatccttgac gagcaaggga ttgacgcttt aaaatgcttg atatggcttt 184 9 
ttatatgtgt tactctacat acagaaa 187 6 

<210> 8 
<211> 4 92 
<212> PRT 

<213> Bacillus subtilis 



<400> 8 



Leu 


Glu 


Lys 


Val 


1 








Asp 


lie 


Tyr 


Leu 








20 


Phe 


He 


Lys 


Lys 






35 




Glu 


Ala 


Asp 


Arg 




50 






Gly 


Lys 


Thr 


He 


65 








Met 


Ser 


Val 


His 


Asp 


Cys 


Val 


Gly 








100 


Asn 


Gly 


Pro 


Arg 






115 




Phe 


His 


Glu 


Ala 




130 






Ser 


Thr 


He 


Gly 


145 








Ala 


Arg 


Ser 


Asp 


Lys 


Glu 


Val 


Gly 








180 


Tyr 


His 


Pro 


Glu 






195 




Asp 


He 


Pro 


Val 




210 






Val 


Leu 


Ser 


Val 


225 








Val 


Asn 


Val 


Asn 



Asp He Phe Lys 
5 

Gly Val Val Gly 

Phe Met Glu Leu 
40 

Ala Arg Ala Gin 
55 

Met Thr Thr Glu 
70 

Val Ser Asp Gly 
85 

Tyr Thr Val Pro 

Met He Asn Thr 
120 

Ala Glu He Gly 
135 

Val Val He Thr 
150 

Tyr lie Glu Ala 
165 

Lys Pro Phe He 

Thr Glu Ala Met 
200 

Leu Ala Met Ser 
215 

Leu Arg Glu Ala 
230 

Leu Pro Ser Trp 



Asp 


He 


Ala 


Glu 




10 






Ala 


Val 


Arg 


Thr 


25 








Val 


Val 


Leu 


Pro 


Asp 


Glu 


Leu 


Pro 








60 


Pro 


Lys 


Phe 


Val 






75 




Leu 


Asp 


Val 


Asn 




90 






Gly 


Ala 


Lys 


Gly 


105 








Pro 


Trp 


Tyr 


Glu 


Thr 


Arg 


Lys 


Val 








140 


Thr 


Asp 


Gly 


Thr 






155 




Glu 


Glu 


Arg 


Val 




170 






Met 


Val 


He 


Asn 


185 








Arg 


Gin 


Asp 


Leu 


Val 


Glu 


Ser 


Met 








220 


Leu 


Tyr 


Glu 


Phe 






235 




Val 


Met 


Val 


Leu 



13 



Arg 


Thr 


Gly 


Gly 






15 




Gly 


Lys 


Ser 


Thr 




30 






Asn 


He 


Ser 


Asn 


45 








Gin 


Ser 


Ala 


Ala 


Pro 


Asn 


Gin 


Ala 








80 


He 


Arg 


Leu 


Val 






95 




Tyr 


Glu 


Asp 


Glu 




110 






Glu 


Pro 


He 


Pro 


125 








He 


Gin 


Glu 


His 


He 


Gly 


Asp 


He 








160 


He 


Glu 


Glu 


Leu 






175 




Ser 


Val 


Arg 


Pro 




190 






Ser 


Glu 


Lys 


Tyr 


205 








Arg 


Glu 


Ser 


Asp 


Pro 


Val 


Leu 


Glu 








240 


Lys 


Glu 


Asn 


His 
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245 










250 










255 




Trp 


Leu 


Arg 


Glu 


Ser 


Tyr 


Gin 


Glu 


Ser 


Val 


Lys 


Glu 


Thr 


Val 


Lys 


Asp 








260 










265 










270 




lie 


Lys 


Arg 


Leu Arg 


Asp 


Val 


Asp 


Ara 


Val 


Val 


Glv 


Gin 


Phe 


Ser 


Glu 






275 










280 










285 








Phe 


Glu 


Phe 


lie 


Glu 


Ser 


Ala 


Glv 


Leu 


Ala 


Glv 


He 


Glu 


Leu 


Gly 


Gin 




290 










295 










300 








Gly 


Val 


Ala 


Glu 


He 


Asp 


Leu 


Tvr 


Ala 


Pro 


Asp 


His 


Leu 




Asp 


Gin 


305 










310 










315 










320 


lie 


Leu 


Lys 


Glu 


Val 
325 


Val 


Glv 


Val 


Glu 


He 
330 


Arg 


Gly 


Arg 


Asp 


His 
335 


T.<=»n 
xjcj u. 


Leu 


Glu 


Leu 


Met 


Gin 


Asp 


Phe 


Ala 


His 


Ala 


Lys 


Thr 


Glu 




7\ «*"t~j 


OXll 








340 










345 










350 




Val 


Ser 


Asp 
355 


Ala 


Leu 


Lvs 


Met 


Val 
360 


Lys 


Gin 


Thr 


Gly 


Tvr 
365 


Gly 


T 1 ~ 


Al a 

nXa 


Ala 


Pro 


Ala 


Leu 


Ala 


Asp 


Met 


Ser 


Leu 


Asp 


Glu 


Pro 


Glu 


He 


He 






370 










375 










380 








Gin 


Gly 


Ser 


Arg 


Phe 


Gly 


Val 


Arg 


Leu 


Lys 


Ala 


Val 


Ala 


Pro 


Q ^ -v- 
OCX 


J_ J_ 


385 










390 










395 










'i \J \J 


His 


Met 


lie 


Lys 


Val 


Asp 


Val 


Glu 


Ser 


Glu 


Phe 


Ala 


Pro 


He 


Tl e*» 


(21 v 










405 










410 










415 


Thr 


Glu 


Lys 


Gin 


Ser 


Glu 


Glu 


Leu 


Val 


Arg 


Tyr 


Leu 


Met 


Gin 


Asp 


Phe 








420 










425 










430 




Glu 


Asp 


Asp 
435 


Pro 


Leu 


Ser 


He 


Trp 
440 


Asn 


Ser 


Asp 


He 


Phe 
445 


Gly 


Arg 


Ser 


Leu 


Ser 
450 


Ser 


He 


Val 


Arg 


Glu 
455 


Gly 


He 


Gin 


Ala 


Lys 
460 


Leu 


Ser 


Leu 


Met 


Pro 


Glu 


Asn 


Ala 


Arg 


Tyr 


Lys 


Leu 


Lys 


Glu 


Thr 


Leu 


Glu 


Arg 


He 


He 


4 65 










470 










475 










480 


Asn 


Glu 


Gly 


Ser 


Gly 


Gly 


Leu 


He 


Ala 


He 


He 


Leu 











485 490 



<210> 9 
<211> 1675 
<212> DNA 

<213> Bacillus subtilis 

<220> 
<221> CDS 

<222> (201) . . (1478) 
<220> 

<221> gene 

<222> (1) . . (1675) 

<223> spoIVB 

<400> 9 

cggatcaagt caaaacaact gggtaagctg cgcgagaagc gcagcttatt tttttcgtgc 60 

acatccattc gttcatcagt atatccaatg tttttcttca tatgacagtt ataaataagc 120 

cgtcagaagg caaaattaaa tgatgtagca gcaagtcata aagaaggtgt gggataggag 18 0 

cgaggagagt gaagtagtga atg ccc gat aac ate aga aaa gca gta ggt tta 233 

Met Pro Asp Asn He Arg Lys Ala Val Gly Leu 
15 10 
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att etc ctt gtt teg tta tta agt gta ggt tta tgc aaa ccg eta aaa 281 
lie Leu Leu Val Ser Leu Leu Ser Val Gly Leu Cys Lys Pro Leu Lys 
15 20 " ~ 25 

gaa tat tta ctg att cca acg caa atg aga gta ttt gaa acc caa aca 329 
Glu Tyr Leu Leu lie Pro Thr Gin Met Arg Val Phe Glu Thr Gin Thr 
30 35 40 

caa gcg att gaa acg agt tta teg gta aat get cag aca tea gaa tec 377 
Gin Ala lie Glu Thr Ser Leu Ser Val Asn Ala Gin Thr Ser Glu Ser 
45 50 55 

tea gaa gcg ttt aca gta aag aaa gat ccg cat gaa ate aag gtg acg 425 
Ser Glu Ala Phe Thr Val Lys Lys Asp Pro His Glu lie Lys Val Thr 
60 65 70 75 

ggc aaa aaa tea ggt gag tea gaa ttg gta tat gat ctt gee gga ttt 473 
Gly Lys Lys Ser Gly Glu Ser Glu Leu Val Tyr Asp Leu Ala Gly Phe 
80 85 "* 90 

cca att aaa aaa aca aaa gtg cat gtt ctt cct gat tta aaa gtt ata 521 
Pro He Lys Lys Thr Lys Val His Val Leu Pro Asp Leu Lys Val He 
95 100 105 

cct ggc gga caa tea ate ggt gta aaa ctt cat tec gtc ggt gtt ctt 569 
Pro Gly Gly Gin Ser He Gly Val Lys Leu His Ser Val Gly Val Leu 
110 115 120 

gtc gga ttt cat caa ate aat aca agt gaa ggc aaa aaa tct ccg gga 617 
Val Gly Phe His Gin He Asn Thr Ser Glu Gly Lys Lys Ser Pro Gly 
125 130 135 

gaa acg gca gga att gaa gcg ggc gac ate att att gag atg aat gga 665 
Glu Thr Ala Gly He Glu Ala Gly Asp He He He Glu Met Asn Gly 
140 145 150 155 

cag aaa att gaa aaa atg aat gat gta gee cca ttt att caa aag get 713 
Gin Lys He Glu Lys Met Asn Asp Val Ala Pro Phe He Gin Lys Ala 
160 165 170 

ggg aaa act ggt gaa tct tta gac tta ctg ate aaa cgt gat aaa cag 7 61 
Gly Lys Thr Gly Glu Ser Leu Asp Leu Leu He Lys Arg Asp Lys Gin 
175 180 185 

aaa ate aaa acg aag ctg ate cca gaa aag gat gaa gga gaa ggc aaa 809 
Lys He Lys Thr Lys Leu He Pro Glu Lys Asp Glu Gly Glu Gly Lys 
190 195 200 

tac aga ate ggg tta tat ate aga gat tct get get ggc ate ggc act 857 
Tyr Arg He Gly Leu Tyr He Arg Asp Ser Ala Ala Gly He Gly Thr 
205 210 215 

atg acc ttt tat gaa ccg aaa aca aaa aaa tac gga gca ctt ggc cae 905 
Met Thr Phe Tyr Glu Pro Lys Thr Lys Lys Tyr Gly Ala Leu Gly His 
220 225 ~ 230 "* 235 

gtg att tec gat atg gac aca aag aaa cca att gta gtg gag aat gga 953 
Val He Ser Asp Met Asp Thr Lys Lys Pro He Val Val Glu Asn Gly 
240 245 250 
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gaa ate gtt aaa tec act gta aca tea att gaa aaa ggg aca ggc ggt 1001 

Glu lie Val Lys Ser Thr Val Thr Ser lie Glu Lys Gly Thr Gly Gly 

255 2 60 2 65 

aat ccg gga gaa aaa ctg gcg cga ttt tec tea gaa cgc aaa acg ate 104 9 

Asn Pro Gly Glu Lys Leu Ala Arg Phe Ser Ser Glu Arg Lys Thr lie 

270 275 280 

ggg gat att aac aga aac age ccg ttt ggg att ttc ggc aca ctg cat 1097 

Gly Asp He Asn Arg Asn Ser Pro Phe Gly He Phe Gly Thr Leu His 

285 290 295 

cag ccg att caa aac aac ata tea gat caa gca ttg ccg gtt gcg ttt 1145 

Gin Pro He Gin Asn Asn He Ser Asp Gin Ala Leu Pro Val Ala Phe 

300 305 310 315 

tct acc gaa gtc aaa aaa ggg ccg get gaa att tta acg gtt att gat 1193 

Ser Thr Glu Val Lys Lys Gly Pro Ala Glu He Leu Thr Val He Asp 

320 325 330 

gat gac aaa gta gaa aaa ttc gat att gaa ate gtc age aca acg ccg 1241 

Asp Asp Lys Val Glu Lys Phe Asp He Glu He Val Ser Thr Thr Pro 

335 340 345 

caa aaa ttc cct gcg aca aaa gga atg gtg ttg aaa att acc gat cca 128 9 

Gin Lys Phe Pro Ala Thr Lys Gly Met Val Leu Lys He Thr Asp Pro 

350 .355 " 360 

aga ctg ttg aaa gaa aca gga ggc ate gta cag ggg atg age gga age 1337 

Arg Leu Leu Lys Glu Thr Gly Gly He Val Gin Gly Met Ser Gly Ser 

365 370 375 

ccg ate att caa aat gga aaa gtg ate ggt get gtc acc cat gta ttt 1385 

Pro He He Gin Asn Gly Lys Val lie Gly Ala Val Thr His Val Phe 

380 385 390 395 

gta aat gac ccg aca age ggc tac ggt gtt eat att gaa tgg atg ctg 1433 

Val Asn Asp Pro Thr Ser Gly Tyr Gly Val His He Glu Trp Met Leu 

400 405 410 

tea gaa gca gga ate gat att tat gga aaa gaa aaa gca age tga 1478 

Ser Glu Ala Gly He Asp He Tyr Gly Lys Glu Lys Ala Ser 

415 - 420 425 

ctgccggagt ttccggcagt ttttttattt tgatccctct tcacttctca gaatacatac 1538 

ggtaaaatat acaaaagaag atttttcgac aaattcacgt ttccttgttt gtcaaatttc 1598 

atttttagtc gaaaaacaga gaaaaacata gaataacaaa gatatgecac taatattggt 1658 

gattatgatt tttttag 1675 



<210> 10 
<211> 425 
<212> PRT 

<213> Bacillus subtilis 
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<400> 10 



Met 


Pro 


Asp 


Asn 


He 


Arg 


Lys 


Ala 


1 








5 








Leu 


Leu 


Ser 


Val 


Gly 


Leu 


Cys 


Lys 








20 










Pro 


Thr 


Gin 


Met 


Arg 


Val 


Phe 


Glu 






35 










40 


Ser 


Leu 


Ser 


Val 


Asn 


Ala 


Gin 


Thr 




50 










55 




Val 


Lys 


Lys 


Asp 


Pro 


His 


Glu 


lie 


65 










70 






Glu 


Ser 


Glu 


Leu 


Val 


Tyr 


Asp 


Leu 










85 








Lys 


Val 


His 


Val 


Leu 


Pro 


Asp 


Leu 








100 










lie 


Gly 


Val 


Lys 


Leu 


His 


Ser 


Val 






115 










120 


lie 


Asn 


Thr 


Ser 


Glu 


Gly 


Lys 


Lys 




130 










135 




Glu 


Ala 


Gly 


Asp 


He 


He 


lie 


Glu 


145 










150 






Met 


Asn 


Asp 


Val 


Ala 


Pro 


Phe 


He 










165 








Ser 


Leu 


Asp 


Leu 


Leu 


He 


Lys 


Arg 








180 










Leu 


He 


Pro 


Glu 


Lys 


Asp 


Glu 


Gly 






195 










200 


Tyr 


He 


Arg 


Asp 


Ser 


Ala 


Ala 


Gly 




210 










215 




Pro 


Lys 


Thr 


Lys 


Lys 


Tyr 


Gly 


Ala 


225 










230 






Asp 


Thr 


Lys 


Lys 


Pro 


He 


Val 


Val 










245 








Thr 


Val 


Thr 


Ser 


He 


Glu 


Lys 


Gly 








260 










Leu 


Ala 


Arg 


Phe 


Ser 


Ser 


Glu 


Arg 






275 










280 


Asn 


Ser 


Pro 


Phe 


Gly 


He 


Phe 


Gly 




290 










295 




Asn 


He 


Ser 


Asp 


Gin 


Ala 


Leu 


Pro 


305 










310 






Lys 


Gly 


Pro 


Ala 


Glu 


He 


Leu 


Thr 










325 








Lys 


Phe 


Asp 


He 


Glu 


He 


Val 


Ser 








340 










Thr 


Lys 


Gly 


Met 


Val 


Leu 


Lys 


He 






355 










360 


Thr 


Gly 


Gly 


He 


Val 


Gin 


Gly 


Met 




370 










375 




Gly 


Lys 


Val 


He 


Gly 


Ala 


Val 


Thr 


385 










390 






Ser 


Gly 


Tyr 


Gly 


Val 


His 


He 


Glu 










405 








Asp 


He 


Tyr 


Gly 


Lys 


Glu 


Lys 


Ala 



420 



<210> 11 



Val 


Gly 
10 


Leu 


He 


Leu 


Leu 


Val 
15 


Ser 


Pro 


Leu 


Lys 


Glu 


Tyr 


Leu 


Leu 


lie 


25 










30 






Thr 


Gin 


Thr 


Gin 


Ala 
45 


lie 


Glu 


Thr 


Ser 


Glu 


Ser 


Ser 
60 


Glu 


Ala 


Phe 


Thr 


Lys 


Val 


Thr 
75 


Gly 


Lys 


L ys 


Ser 


Gly 
80 


Ala 


Gly 
90 


Phe 


Pro 


He 


Lys 


Lys 
95 


Thr 


Lys 


Val 


He 


Pro 


Gly 


Gly 


Gin 


Ser 


105 










110 






Gly 


Val 


Leu 


Val 


Gly 
125 


Phe 


His 


Gin 


Ser 


Pro 


Gly 


Glu 
140 


Thr 


Ala 


Gly 


He 


Met 


Asn 


Gly 
155 


Gin 


Lys 


He 


Glu 


Lys 
160 


Gin 


Lys 
170 


Ala 


Gly 


Lys 


Thr 


Gly 
175 


Glu 


Asp 


Lys 


Gin 


Lys 


lie 


Lys 


Thr 


Lys 


185 










190 






Glu 


Gly 


Lys 


Tyr 


Arg 
205 


lie 


Gly 


Leu 


He 


Gly 


Thr 


Met 

220 


Thr 


Phe 


Tyr 


Glu 


Leu 


Gly 


His 
235 


Val 


He 


Ser 


Asp 


Met 
240 


Glu 


Asn 
250 


Gly 


Glu 


He 


Val 


Lys 
255 


Ser 


Thr 


Gly 


Gly 


Asn 


Pro 


Gly 


Glu 


Lys 


265 










270 






Lys 


Thr 


He 


Gly 


Asp 
285 


He 


Asn 


Arg 


Thr 


Leu 


His 


Gin 
300 


Pro 


He 


Gin 


Asn 


Val 


Ala 


Phe 
315 


Ser 


Thr 


Glu 


Val 


Lys 
320 


Val 


He 
330 


Asp 


Asp 


Asp 


Lys 


Val 
335 


Glu 


Thr 


Thr 


Pro 


Gin 


Lys 


Phe 


Pro 


Ala 


345 










350 






Thr 


Asp 


Pro 


Arg 


Leu 
365 


Leu 


Lys 


Glu 


Ser 


Gly 


Ser 


Pro 
380 


lie 


He 


Gin 


Asn 


His 


Val 


Phe 
395 


Val 


Asn 


Asp 


Pro 


Thr 
400 


Trp 


Met 
410 


Leu 


Ser 


Glu 


Ala 


Gly 
415 


He 



Ser 
425 
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<211> 1900 
<212> DNA 

<213> Bacillus subtilis 

<220> 
<221> CDS 

<222> (201) . . (1703) 
<220> 

<221> gene 

<222> (1) . . (1900) 

<223> spoIVCA 

<220> 

<221> mis cofeature 
<222> (201) . . (203) 

<223> First codon translated as Met . 
<400> 11 

ttttgcatat tcattgaaac gtttaataac actatagttt aatttaaaat ctcctcattt 60 

ggacaaacag ctgttacata gcattaccca aggggtgatg cattttatga aagtgataat 120 

catcgaggga ccgcaagctg acaaatgcat taacgattgc tatcattatt taataaaact 180 

ttataggaag gagattcagg gtg ata gca ata tat gta agg gta teg acc gag 233 

Val lie Ala lie Tyr Val Arg Val Ser Thr Glu 
15 10 

gaa caa gcg ate aag gga teg age ate gac age caa ate gag gee tgt 281 
Glu Gin Ala lie Lys Gly Ser Ser lie Asp Ser Gin lie Glu Ala Cys 
15 20 25 

ata aag aaa gca ggg act aaa gat gtg ctg aag tat gca gat gaa gga 329 
lie Lys Lys Ala Gly Thr Lys Asp Val Leu Lys Tyr Ala Asp Glu Gly 
30 35 40 

ttt tea gga gag ctt tta gaa cgt ccg get ttg aat cgc ttg agg gag 377 
Phe Ser Gly Glu Leu Leu Glu Arg Pro Ala Leu Asn Arg Leu Arg Glu 
45 50 55 

gat gca age aag gga ctt ata agt caa gtc att tgt tac gat cct gac 425 
Asp Ala Ser Lys Gly Leu lie Ser Gin Val lie Cys Tyr Asp Pro Asp 
60 65 70 75 

cgt ctt tct egg aaa tta atg aat cag eta ate att gat gac gaa ttg 473 
Arg Leu Ser Arg Lys Leu Met Asn Gin Leu lie lie Asp Asp Glu Leu 

80 85 90 

cga aag cga aac ata cct ttg att ttt gta aat ggt gaa tac gee aat 521 
Arg Lys Arg Asn lie Pro Leu lie Phe Val Asn Gly Glu Tyr Ala Asn 
95 100 105 

tct cca gaa ggt caa ttg ttt ttc gca atg cgc ggg gca ate tea gaa 569 
Ser Pro Glu Gly Gin Leu Phe Phe Ala Met Arg Gly Ala lie Ser Glu 
110 115 " " 120 

ttt gaa aaa gee aaa ate aaa gaa egg aca tea age ggc cga ctt caa 617 
Phe Glu Lys Ala Lys lie Lys Glu Arg Thr Ser Ser Gly Arg Leu Gin 
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125 130 135 

aaa atg aaa aaa ggc atg ate att aaa gat tct aaa eta tat ggc tat 665 
Lys Met Lys Lys Gly Met lie lie Lys Asp Ser Lys Leu Tyr Gly Tyr 
14 0 145 150 " 155 

aaa ttt gtt aaa gag aaa aga act ctt gag ata tta gaa gag gaa gca 713 
Lys Phe Val Lys Glu Lys Arg Thr Leu Glu He Leu Glu Glu Glu Ala 
160 165 170 

aaa ate att egg atg att ttt aac tat ttc ace gat cat aaa age cct 761 
Lys lie He Arg Met He Phe Asn Tyr Phe Thr Asp His Lys Ser Pro 
175 180 185 

ttt ttc ggc aga gta aat ggt att get eta cat tta act cag atg ggg 8 09 
Phe Phe Gly Arg Val Asn Gly He Ala Leu His Leu Thr Gin Met Gly 
190 195 200 

gtt aaa aca aaa aaa ggc gec aaa gta tgg cac agg cag gtt gtt egg 857 
Val Lys Thr Lys Lys Gly Ala Lys Val Trp His Arg Gin Val Val Arg 
205 210 215 

caa ata tta atg aac tct tec tat aag ggt gaa cat aga cag tat aaa 905 
Gin He Leu Met Asn Ser Ser Tyr Lys Gly Glu His Arg Gin Tyr Lys 
220 225 230 " 235 

tat gat aca gag ggt tec tat gtt tea aag cag gca ggg aac aaa tct 953 
Tyr Asp Thr Glu Gly Ser Tyr Val Ser Lys Gin Ala Gly Asn Lys Ser 
240 245 250 

ata att aaa ata agg cct gaa gaa gaa caa ate act gtg aca att cca 1001 
He He Lys He Arg Pro Glu Glu Glu Gin He Thr Val Thr He Pro 
255 260 2 65 

gca att gtt cca get gaa caa tgg gat tat get caa gaa etc tta ggt 104 9 
Ala He Val Pro Ala Glu Gin Trp Asp Tyr Ala Gin Glu Leu Leu Gly 
270 275 280 

caa agt aaa aga aaa cac ttg agt ate age cct cac aat tac ttg tta 1097 
Gin Ser Lys Arg Lys His Leu Ser He Ser Pro His Asn Tyr Leu Leu 
285 290 295 

teg ggt ttg gtt aga tgc gga aaa tgc gga aat ace atg aca ggg aag 1145 
Ser Gly Leu Val Arg Cys Gly Lys Cys Gly Asn Thr Met Thr Gly Lys 
300 305 310 315 

aaa aga aaa tea cat ggt aaa gac tac tat gta tat act tgc egg aaa 1193 
Lys Arg Lys Ser His Gly Lys Asp Tyr Tyr Val Tyr Thr Cys Arg Lys 
320 325 330 

aat tat tct ggc gca aag gac cgc ggc tgc gga aaa gaa atg tct gag 1241 
Asn Tyr Ser Gly Ala Lys Asp Arg Gly Cys Gly Lys Glu Met Ser Glu 
335 340 * 345 

aat aaa ttg aac egg cat gta tgg ggt gaa att ttt aaa ttc ate aca 1289 
Asn Lys Leu Asn Arg His Val Trp Gly Glu He Phe Lys Phe He Thr 
350 355 360 

aat cct caa aag tat gtt tct ttt aaa gag get gaa caa tea aat cac 1337 
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Asn Pro Gin Lys Tyr Val Ser Phe Lys Glu Ala Glu Gin Ser Asn His 
365 370 375 

ctg tct gat gaa tta gaa ctt att gaa aaa gag ata gag aaa aca aaa 1385 
Leu Ser Asp Glu Leu Glu Leu lie Glu Lys Glu lie Glu Lys Thr Lys 
380 385 390 395 

aaa ggc cgc aag cgt ctt tta acg eta ate age eta age gat gac gat 1433 
Lys Gly Arg Lys Arg Leu Leu Thr Leu lie Ser Leu Ser Asp Asp Asp 
400 405 410 

gat tta gac ata gat gaa ate aaa gca caa att att gaa ctg caa aaa 1481 
Asp Leu Asp lie Asp Glu lie Lys Ala Gin lie lie Glu Leu Gin Lys 
415 420 425 

aag caa aat cag ctt act gaa aag tgt aac aga ate cag tea aaa atg 1529 
Lys Gin Asn Gin Leu Thr Glu Lys Cys Asn Arg lie Gin Ser Lys Met 
430 435 440 

aaa gtc eta gat gat acg age tea agt gaa aat get eta aaa aga gee 1577 
Lys Val Leu Asp Asp Thr Ser Ser Ser Glu Asn Ala Leu Lys Arg Ala 
445 450 455 

ate gac tat ttt caa tea ate ggt gca gat aac tta act ctt gaa gat 1625 
lie Asp Tyr Phe Gin Ser lie Gly Ala Asp Asn Leu Thr Leu Glu Asp 
460 465 470 475 

aaa aaa aca att gtt aac ttt ate gtg aaa gaa gtt acc att gtg gat 1673 
Lys Lys Thr lie Val Asn Phe He Val Lys Glu Val Thr He Val Asp 
480 485 490 

tct gac acc ata tat att gaa acg tat taa agaggggtgt atgcaccccc 1723 
Ser Asp Thr He Tyr He Glu Thr Tyr 
495 500 

cttttgtaat tacaatctca ttttcaatac acctcgctgc atacgtcgcc acctttgtcc 1783 

cttttccagc ggaatagctt tcaattcctt taataagece gatcgttccg atggagatta 1843 

agtcctctgc atcctcacct gtattttcga actttttcac aatatgggcg accaagc 1900 



<210> 12 
<211> 500 
<212> PRT 

<213> Bacillus subtilis 



<400> 12 



Val 


He 


Ala 


He 


Tyr 


Val 


Arg 


Val 


1 








5 








Gly 


Ser 


Ser 


He 
20 


Asp 


Ser 


Gin 


He 


Thr 


Lys 


Asp 
35 


Val 


Leu 


Lys 


Tyr 


Ala 
40 


Leu 


Glu 


Arg 


Pro 


Ala 


Leu 


Asn 


Arg 




50 










55 


Leu 


He 


Ser 


Gin 


Val 


He 


Cys 


Tyr 


65 










70 






Leu 


Met 


Asn 


Gin 


Leu 


He 


He 


Asp 



Ser 


Thr 


Glu 


Glu 


Gin 


Ala 


He 


Lys 




10 










15 




Glu 


Ala 


Cys 


He 


Lys 


Lys 


Ala 


Gly 


25 










30 






Asp 


Glu 


Gly 


Phe 


Ser 


Gly Glu 


Leu 










45 








Leu 


Arg 


Glu 


Asp Ala 


Ser 


Lys 


Gly 








60 










Asp 


Pro 


Asp 


Arg 


Leu 


Ser 


Arg 


Lys 






75 










80 


Asp 


Glu 


Leu 


Arg 


Lys 


Arg 


Asn 


He 
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85 



Pro 


Leu 


He 


Phe 


Val 


Asn 


Gly 


Glu 








100 










Leu 


Phe 


Phe 


Ala 


Met 


Arg 


Gly 


Ala 






115 










120 


lie 


Lys 


Glu 


Arg 


Thr 


Ser 


Ser 


Gly 




130 










135 




Met 


He 


He 


Lys 


Asp 


Ser 


Lys 


Leu 


145 










150 






Lys 


Arg 


Thr 


Leu 


Glu 


He 


Leu 


Glu 










165 








lie 


Phe 


Asn 


Tyr 


Phe 


Thr 


Asp 


His 








180 










Asn 


Gly 


He 


Ala 


Leu 


His 


Leu 


Thr 






195 










200 


Gly 


Ala 


Lys 


Val 


Trp 


His 


Arg 


Gin 




210 










215 




Ser 


Ser 


Tyr 


Lys 


Gly 


Glu 


His 


Arg 


225 










230 






Ser 


Tyr 


Val 


Ser 


Lys 


Gin 


Ala 


Gly 










245 








Pro 


Glu 


Glu 


Glu 


Gin 


He 


Thr 


Val 








260 










Glu 


Gin 


Trp 


Asp 


Tyr 


Ala 


Gin 


Glu 






275 










280 


His 


Leu 


Ser 


He 


Ser 


Pro 


His 


Asn 




290 










295 




Cys 


Gly 


Lys 


Cys 


Gly 


Asn 


Thr 


Met 


305 










310 






Gly 


Lys 


Asp 


Tyr 


Tyr 


Val 


Tyr 


Thr 










325 








Lys 


Asp 


Arg 


Gly 


Cys 


Gly 


Lys 


Glu 








340 










His 


Val 


Trp 


Gly 


Glu 


He 


Phe 


Lys 






355 










360 


Val 


Ser 


Phe 


Lys 


Glu 


Ala 


Glu 


Gin 




370 










375 




Glu 


Leu 


He 


Glu 


Lys 


Glu 


He 


Glu 


385 










390 






Leu 


Leu 


Thr 


Leu 


He 


Ser 


Leu 


Ser 










405 








Glu 


He 


Lys 


Ala 


Gin 


He 


lie 


Glu 








420 










Thr 


Glu 


Lys 


Cys 


Asn 


Arg 


He 


Gin 






435 










440 


Thr 


Ser 


Ser 


Ser 


Glu 


Asn 


Ala 


Leu 




450 










455 




Ser 


He 


Gly 


Ala 


Asp 


Asn 


Leu 


Thr 


465 










470 






Asn 


Phe 


He 


Val 


Lys 


Glu 


Val 


Thr 










485 








He 


Glu 


Thr 


Tyr 











500 



<210> 13 
<211> 868 
<212> DNA 





90 










95 




Tyr 


Ala 


Asn 


Ser 


Pro 


Glu 


Gly 


Gin 


105 










110 






He 


Ser 


Glu 


Phe 


Glu 


Lys 


Ala 


Lys 










125 








Arg 


Leu 


Gin 


Lys 


Met 


Lys 


Lys 


Gly 








140 










Tyr 


Gly 


Tyr 


Lys 


Phe 


Val 


Lys 


Glu 






155 










160 


Glu 


Glu 


Ala 


Lys 


He 


He 


Arg 


Met 




170 










175 




Lys 


Ser 


Pro 


Phe 


Phe 


Gly 


Arg 


Val 


185 










190 






Gin 


Met 


Gly 


Val 


Lys 


Thr 


Lys 


Lys 










205 








Val 


Val 


Arg 


Gin 


He 


Leu 


Met 


Asn 








220 










Gin 


Tyr 


Lys 


Tyr 


Asp 


Thr 


Glu 


Gly 






235 










240 


Asn 


Lys 


Ser 


He 


He 


Lys 


lie 


Arg 




250 










255 




Thr 


He 


Pro 


Ala 


lie 


Val 


Pro 


Ala 


265 










270 






Leu 


Leu 


Gly 


Gin 


Ser 


Lvs 


Ara 


Lvs 










285 








Tyr 


Leu 


Leu 


Ser 


Gly 


Leu 


Val 


Arg 








300 










Thr 


Gly 


Lys 


Lys 


Arg 


Lvs 


Ser 


His 






315 










320 


Cys 


Arg 


Lys 


Asn 


Tyr 


Ser 


Gly 


Ala 




330 










335 




Met 


Ser 


Glu 


Asn 


Lys 


Leu 


Asn 


Arg 


345 










350 






Phe 


He 


Thr 


Asn 


Pro 


Gin 


Lvs 


Tvr 










365 








Ser 


Asn 


His 


Leu 


Ser 


Asp 


Glu 


Leu 








380 










Lys 


Thr 


Lys 


Lys 


Gly 


Arg 


Lys 


Arg 






395 










400 


Asp 


Asp 


Asp 


Asp 


Leu 


Asp 


He 


Asp 




410 










415 




Leu 


Gin 


Lys 


Lys 


Gin 


Asn 


Gin 


Leu 


425 










430 






Ser 


Lys 


Met 


Lys 


Val 


Leu 


Asp 


Asp 










445 








Lys 


Arg 


Ala 


lie 


Asp 


Tyr 


Phe 


Gin 








460 










Leu 


Glu 


Asp 


Lys 


Lys 


Thr 


He 


Val 






475 










480 


He 


Val 


Asp 


Ser 


Asp 


Thr 


lie 


Tyr 




490 










495 
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<213> Bacillus subtilis 

<220> 

<221> CDS 

<222> (201) . . (671) 

<220> 

<221> gene 
<222> (1) . . (868) 
<223> spoIVCB 

<400> 13 

ttcatcccca tccccccata cctttgttca tttcaatgta tgggcgcttg atgaagaata 60 

tttttaacat ttgaagttag tatgctgctt accaaagccg gactcccccg cgagaaattt 120 

cccggtacag acacagacag cctcccggtc acatacattt acatataggc ttttgcctac 180 

atacttttgt ggaggtgacg atg gtg aca ggt gtt ttc gca gcg etc ggc ttt 233 

Met Val Thr Gly Val Phe Ala Ala Leu Gly Phe 
15 10 

gtt gtt aaa gag ctt gtc ttt tta gta tct tac gtg aaa aac aat gec 281 
Val Val Lys Glu Leu Val Phe Leu Val Ser Tyr Val Lys Asn Asn Ala 
15 20 " 25 

ttt cca caa ccg etc tea age age gaa gaa aaa aaa tac tta gag etc 329 
Phe Pro Gin Pro Leu Ser Ser Ser Glu Glu Lys Lys Tyr Leu Glu Leu 
30 35 ~ 40 

atg get aaa ggg gat gaa cat gee aga aac atg ctg att gag cat aat 377 
Met Ala Lys Gly Asp Glu His Ala Arg Asn Met Leu lie Glu His Asn 
45 50 55 

ctt cgc ttg gtc gee cat att gtg aaa aag ttc gaa aat aca ggt gag 4 25 
Leu Arg Leu Val Ala His lie Val Lys Lys Phe Glu Asn Thr Gly Glu 
60 65 70 75 

gat gca gag gac tta ate tec ate gga acg ate ggg ctt att aaa gga 473 
Asp Ala Glu Asp Leu lie Ser He Gly Thr He Gly Leu He Lys Gly 

80 85 ~ 90 

att gaa age tat tec get gga aaa ggg aca aag gtg gcg acg tat gca 521 
He Glu Ser Tyr Ser Ala Gly Lys Gly Thr Lys Val Ala Thr Tyr Ala 
95 100 105 

gcg agg tgt att gaa aat gag att gta att aca aaa ggg ggg tgc at a 5 69 
Ala Arg Cys He Glu Asn Glu He Val He Thr Lys Gly Gly Cys He 
110 115 ~ 120 

cac ccc tct tta ata cgt ttc aat ata tat ggt gtc aga ate cac aat 617 
His Pro Ser Leu He Arg Phe Asn He Tyr Gly Val Arg He His Asn 
125 130 135 

ggt aac ttc ttt cac gat aaa gtt aac aat tgt ttt ttt ate ttc aag 665 
Gly Asn Phe Phe His Asp Lys Val Asn Asn Cys Phe Phe He Phe Lys 
140 145 150 155 

agt taa gttatctgea ccgattgatt gaaaatagtc gatggctctt tttagagcat 721 
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Ser 

tttcacttga gctcgtatca tctaggactt tcatttttga ctggattctg ttacactttt 781 
cagtaagctg attttgcttt ttttgcagtt caataatttg tgctttgatt tcatctatgt 841 
ctaaatcatc gtcatcgctt aggctga 8 68 



<210> 14 
<211> 156 
<212>.PRT 

<213> Bacillus subtilis 
<400> 14 



Met 


Val 


Thr 


Gly Val 


Phe 


Ala 


Ala 


Leu 


Gly 


Phe 


Val 


Val 


Lys 


Glu 


Leu 


1 






5 










10 










15 




Val 


Phe 


Leu 


Val Ser 


Tyr 


Val 


Lys 


Asn 


Asn 


Ala 


Phe 


Pro 


Gin 


Pro 


Leu 








20 








25 










30 






Ser 


Ser 


Ser 


Glu Glu 


Lys 


Lys 


Tyr 


Leu 


Glu 


Leu 


Met 


Ala 


Lys 


Gly 


Asp 






35 








40 










45 


Glu 


His 


Ala 


Arg Asn 


Met 


Leu 


He 


Glu 


His 


Asn 


Leu 


Arg 


Leu 


Val 


Ala 




50 








55 










60 








His 


He 


Val 


Lys Lys 


Phe 


Glu 


Asn 


Thr 


Gly 


Glu 


Asp 


Ala 


Glu 


Asp 


Leu 


65 








70 










75 








80 


He 


Ser 


He 


Gly Thr 


He 


Gly 


Leu 


He 


Lys 


Gly 


He 


Glu 


Ser 


Tyr 


Ser 








85 










90 










95 




Ala 


Gly 


Lys 


Gly Thr 


Lys 


Val 


Ala 


Thr 


Tyr 


Ala 


Ala 


Arg 


Cys 


He 


Glu 








100 








105 










110 






Asn 


Glu 


He 


Val He 


Thr 


Lys 


Gly 


Gly 


Cys 


He 


His 


Pro 


Ser 


Leu 


He 






115 








120 










125 








Arg 


Phe 


Asn 


He Tyr 


Gly 


Val 


Arg 


He 


His 


Asn 


Gly 


Asn 


Phe 


Phe 


His 




130 








135 










140 










Asp 


Lys 


Val 


Asn Asn 


Cys 


Phe 


Phe 


He 


Phe 


Lys 


Ser 










145 








150 










155 













<210> 15 
<211> 1192 
<212> DNA 

<213> Bacillus subtilis 

<220> 

<221> CDS 

<222> (201) . . (995) 

<220> 

<221> gene 

<222> (1) . . (1192) 

<223> spoIVFA 

<400> 15 

acaaaggaat gatggctaag attaagtcat ttttcggagt aagatcttaa tgtgatagaa 60 

tcaaagagaa gaatctgaca aagcatatgc tgtgtcaggt ttttttttgt ttttgcctgc 120 

tttgttcttg actaaaccga atatttgcca tggacaagac atatgatgta caaacccaac 180 
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gaatgcaaag gatgatggca atg agt cac aga gca gat gaa ate aga aaa cga 233 

Met Ser His Arg Ala Asp Glu lie Arg Lys Arg 
1 5 10 

tta gag aaa aga aga aag cag ctt tec ggc tea aaa cgt ttc tct act 281 
Leu Glu Lys Arg Arg Lys Gin Leu Ser Gly Ser Lys Arg Phe Ser Thr 
15 20 ~ ' 25 

cag aca gtt tct gaa aag cag aaa ccc ccg tec tgg gtg atg gta acg 329 
Gin Thr Val Ser Glu Lys Gin Lys Pro Pro Ser Trp Val Met Val Thr 
30 35 40 

gat cag gaa aag cat gga aca ctt ccg gtc tac gaa gat aac atg cca 377 
Asp Gin Glu Lys His Gly Thr Leu Pro Val Tyr Glu Asp Asn Met Pro 
45 ^ 50 55 

aca ttc aac gga aaa cac cca ttg gtg aaa aca gat tea att ate ctg 425 
Thr Phe Asn Gly Lys His Pro Leu Val Lys Thr Asp Ser lie He Leu 
60 65 " 70 75 

aaa tgt ctt ctg teg gee tgc ctt gtt etc gtt tea get ata gee tat 473 

l y s c y s Leu Leu Ser Aia cys Leu Val Leu Val Ser Ala Ile Ala T y r 

'80 85 90 

aaa aca aac att gga ccc gtc agt cag att aaa ccc gee gta gee aaa 521 
Lys Thr Asn He Gly Pro Val Ser Gin He Lys Pro Ala Val Ala Lys 
■ 95 100 - 105 

ace ttt gaa act gaa ttt caa ttt get tea gca age cat tgg ttc gaa 569 
Thr Phe Glu Thr Glu Phe Gin Phe Ala Ser Ala Ser His Trp Phe Glu 
110 115 120 

ace aaa ttc gga aat ccg ctt get ttc ctg get cct gaa cac aaa aat 617 
Thr Lys Phe Gly Asn Pro Leu Ala Phe Leu Ala Pro Glu His Lys Asn 
125 130 135 

aag gaa cag cag att gaa gta ggc aaa gat ctg ate gcg cct gca tec 665 
Lys Glu Gin Gin He Glu Val Gly Lys Asp Leu He Ala Pro Ala Ser 
140 145 150 155 

ggg aaa gta cag cag gat ttt cag gac aat ggg gaa gga att aaa gtc 713 
Gly Lys Val Gin Gin Asp Phe Gin Asp Asn Gly Glu Gly He Lys Val 
160 165 170 

gaa aca age agt gat aag att gat age gta aaa gaa ggc tat gtg gtt 7 61 
Glu Thr Ser Ser Asp Lys He Asp Ser Val Lys Glu Gly Tyr Val Val 
175 180 185 

gaa gtc age aaa gac age caa acg gga ctg acg gtt aag gtg cag cat 809 
Glu Val Ser Lys Asp Ser Gin Thr Gly Leu Thr Val Lys Val Gin His 
190 195 200 

get gac aac ace tat agt ate tat ggc gag etc aaa gat gtg gat gtt 857 
Ala Asp Asn Thr Tyr Ser lie Tyr Gly Glu Leu Lys Asp Val Asp Val 
205 210 * 215 

get tta tat gat ttt gtg gat aaa ggc aaa aag etc ggt teg att aag 905 
Ala Leu Tyr Asp Phe Val Asp Lys Gly Lys Lys Leu Gly Ser He Lys 
220 ~ 225 230 235 
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ctt gat gat cat aat aaa ggg gtc tat tat ttt gcc atg aaa gac ggc 953 
Leu Asp Asp His Asn Lys Gly Val Tyr Tyr Phe Ala Met Lys Asp Gly 
240 245 250 

gat aaa ttt att gat ccg att cag gtg att tea ttt gaa taa 995 
Asp Lys Phe lie Asp Pro He Gin Val He Ser Phe Glu 

255 260 265 

atggctcgac cttatcttaa agatccatgt gcatcctttt ctttggatta ttgeggeget 1055 

gggcttgetc acaggecata tgaaagcatt attatgtctg ctcctgattg tattgattca 1115 

tgagctgggg catgctgctc tggctgtgtt tttttcttgg agaatcaagc gtgttttttt 1175 

gctgccgttt ggcggaa 1192 



<210> 16 
<211> 264 
<212> PRT 

<213> Bacillus subtilis 



<400> 16 



Met 


Ser 


His 


Arg Ala 


Asp 


Glu 


He 


1 








5 








Lys 


Gin 


Leu 


Ser 


Gly 


Ser 


Lys 


Arg 








20 










Lys 


Gin 


Lys 


Pro 


Pro 


Ser 


Trp 


Val 






35 










40 


Gly 


Thr 


Leu 


Pro 


Val 


Tyr 


Glu 


Asp 




50 










55 


His 


Pro 


Leu 


Val 


Lys 


Thr 


Asp 


Ser 


65 










70 






Ala 


Cys 


Leu 


Val 


Leu 


Val 


Ser 


Ala 










85 








Pro 


Val 


Ser 


Gin 


He 


Lys 


Pro 


Ala 








100 










Phe 


Gin 


Phe 


Ala 


Ser 


Ala 


Ser 


His 






115 










120 


Pro 


Leu 


Ala 


Phe 


Leu 


Ala 


Pro 


Glu 




130 










135 




Glu 


Val 


Gly 


Lys 


Asp 


Leu 


He 


Ala 


145 










150 






Asp 


Phe 


Gin 


Asp 


Asn 


Gly 


Glu 


Gly 










165 








Lys 


He 


Asp 


Ser 


Val 


Lys 


Glu 


Gly 








180 










Ser 


Gin 


Thr 


Gly 


Leu 


Thr 


Val 


Lys 






195 










200 


Ser 


He 


Tyr 


Gly 


Glu 


Leu 


Lys 


Asp 




210 










215 




Val 


Asp 


Lys 


Gly Lys 


Lys 


Leu 


Gly 


225 










230 






Lys 


Gly Val 


Tyr 


Tyr 


Phe 


Ala 


Met 










245 








Pro 


He 


Gin 


Val 


He 


Ser 


Phe 


Glu 



260 



Arg 


Lys 


Arg 


Leu 


Glu 


Lys 


Arg 


Arg 




10 










15 




Phe 


Ser 


Thr 


Gin 


Thr 


Val 


Ser 


Glu 


25 










30 






Met 


Val 


Thr 


Asp 


Gin 


Glu 


Lys 


His 










45 








Asn 


Met 


Pro 


Thr 


Phe 


Asn 


Gly 


Lys 








60 








He 


He 


Leu 


Lys 


Cys 


Leu 


Leu 


Ser 






75 










80 


He 


Ala 


Tyr 


Lys 


Thr 


Asn 


He 


Gly 




90 










95 


Val 


Ala 


Lys 


Thr 


Phe 


Glu 


Thr 


Glu 


105 










110 






Trp 


Phe 


Glu 


Thr 




Phe 


Gly 


Asn 










125 








His 


Lys 


Asn 


Lys 


Glu 


Gin 


Gin 


He 








140 










Pro 


Ala 


Ser 


Gly 


Lys 


Val 


Gin 


Gin 






155 










160 


He 


Lys 


Val 


Glu 


Thr 


Ser 


Ser 


Asp 




170 










175 


Tyr 


Val 


Val 


Glu 


Val 


Ser 


Lys 


Asp 


185 










190 




Val 


Gin 


His 


Ala 


Asp 


Asn 


Thr 


Tyr 










205 








Val 


Asp 


Val 


Ala 


Leu 


Tyr Asp 


Phe 








220 










Ser 


He 


Lys 


Leu 


Asp 


Asp 


His 


Asn 






235 










240 


Lys 


Asp 


Gly Asp 


Lys 


Phe 


He 


Asp 




250 










255 





25 



H 06291 



<210> 17 

<211> 1264 

<212> DNA 

<213> Bacillus subtilis 

<220> 
<221> CDS 

<222> (201) . . (1067) 
<220> 

<221> gene 

<222> (1) . . (1264) 

<223> spoIVFB 

<220> 

<221> misc_f eature 
<222> (201) . . (203) 

<223> First codon translated as Met. 
<400> 17 

actgacggtt aaggtgcagc atgctgacaa cacctatagt atctatggcg agctcaaaga 60 

tgtggatgtt gctttatatg attttgtgga taaaggcaaa aagctcggtt cgattaagct 120 

tgatgatcat aataaagggg tctattattt tgccatgaaa gacggcgata aatttattga 180 

tccgattcag gtgatttcat ttg aat aaa tgg etc gac ctt ate tta aag ate 233 

Leu Asn Lys Trp Leu Asp Leu He Leu Lys He 
15 10 

cat gtg cat cct ttt ctt tgg att att gcg gcg ctg ggc ttg etc aca 281 
His Val His Pro Phe Leu Trp He He Ala Ala Leu Gly Leu Leu Thr 
15 20 25 

ggc cat atg aaa gca tta tta tgt ctg etc ctg att gta ttg att cat 329 
Gly His Met Lys Ala Leu Leu Cys Leu Leu Leu He Val Leu He His 
30 35 40 

gag ctg ggg cat get get ctg get gtg ttt ttt tct tgg aga ate aag 377 
Glu Leu Gly His Ala Ala Leu Ala Val Phe Phe Ser Trp Arg He Lys 
4 5 50 55 

cgt gtt ttt ttg ctg ccg ttt ggc gga acg gtc gaa gtg gaa gag cac 425 
Arg Val Phe Leu Leu Pro Phe Gly Gly Thr Val Glu Val Glu Glu His 
60 65 70 75 

ggg aat egg ccg tta aag gaa gag ttt gcg gtc att att gee gga cct 473 
Gly Asn Arg Pro Leu Lys Glu Glu Phe Ala Val He lie Ala Gly Pro 
80 85 90 

ctt cag cac ate tgg ctt cag ttt gee gee tgg atg ctt gca gaa gtc 521 
Leu Gin His He Trp Leu Gin Phe Ala Ala Trp Met Leu Ala Glu Val 
95 100 105 

tea gtg att cat cag cat ace ttt gaa etc ttc acc ttt tat aat ctt 569 
Ser Val He His Gin His Thr Phe Glu Leu Phe Thr Phe Tyr Asn Leu 
110 115 120 
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tct ate tta ttt gtc aat tta ctg ccg ate tgg ccg ctg gat gga gga 617 
Ser lie Leu Phe Val Asn Leu Leu Pro lie Trp Pro Leu Asp Gly Gly 
125 130 135 

aaa ctg tta ttt ttg ttg ttt tec aaa cag ctg cct ttt caa aag get 665 
Lys Leu Leu Phe Leu Leu Phe Ser Lys Gin Leu Pro Phe Gin Lys Ala 
140 145 150 155 

cac egg ctt aat eta aaa acg teg etc tgc ttc tgc ctg ctg etc ggg 713 
His Arg Leu Asn Leu Lys Thr Ser Leu Cys Phe Cys Leu Leu Leu Gly 
160 165 170 

tgc tgg gtt tta ttc gtg att cct ctg caa ate age gca tgg gtt ttg 7 61 
Cys Trp Val Leu Phe Val lie Pro Leu Gin lie Ser Ala Trp Val Leu 
175 180 185 

ttt gtc ttt ctg get gtt tec ttg ttt gag gaa tat egg caa agg cac 809 
Phe Val Phe Leu Ala Val Ser Leu Phe Glu Glu Tyr Arg Gin Arg His 
190 195 200 

tat ate cat gtg aga ttt etc etc gaa agg tat tac gga aaa aac agg 857 
Tyr lie His Val Arg Phe Leu Leu Glu Arg Tyr Tyr Gly Lys Asn Arg 
205 210 215 

gag ctt gag aaa ctt ctg ccg ctg aca gta aag gcg gag gat aaa gtc 905 
Glu Leu Glu Lys Leu Leu Pro Leu Thr Val Lys Ala Glu Asp Lys Val 
220 225 230 235 

tat cat gtg atg gee gag ttc aaa cgt ggc tgt aag cat ccg att att 953 
Tyr His Val Met Ala Glu Phe Lys Arg Gly Cys Lys His Pro lie lie 
240 245 250 

ata gaa aaa tea ggc caa aag etc age cag ctt gac gag aat gaa gtg 1001 
lie Glu Lys Ser Gly Gin Lys Leu Ser Gin Leu Asp Glu Asn Glu Val 
255 260 265 

ctg cac get tac ttt gee gat aag egg acg aat tct tec atg gag gaa 1049 
Leu His Ala Tyr Phe Ala Asp Lys Arg Thr Asn Ser Ser Met Glu Glu 
270 275 280 

ctg ctt ctg ccc tac taa aactgattga caaacgcctt gtattttggt 1097 
Leu Leu Leu Pro Tyr 
285 

atatttttta atgttatgga tgtagcacca ttgetacaac cgctcagtac aggtgttaag 1157 

agcttttaca gccccctggt atetggegag tcttagtcta ataggaggtg cagagaatgt 1217 

aegcaatcat taaaacaggc ggtaaacaaa tcaaagttga agaaggc 1264 



<210> 18 
<211> 288 
<212> PRT 

<213> Bacillus subtilis 
<400> 18 

Leu Asn Lys Trp Leu Asp Leu lie Leu Lys lie His Val His Pro Phe 
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1 








5 










10 










15 




Leu. 


Tro 


lie 


lie 


Ala 


Ala 


Leu 


Gly 


Leu 


Leu 


Thr 


Gly 


His 


Met 


Lys 


AT Fi 








20 










25 










30 






Leu 


Leu 


Cys 


Leu 


Leu 


Leu 


lie 


Val 


Leu 


lie 


His 


Glu 


Leu 


Gly 


His 


Ala 






35 










40 










45 








Ala 


Leu 


Ala 


Val 


Phe 


Phe 


Ser 


x ip 


Arg 


lie 


Lys 


Arg 


Val 


Phe 


Leu 


Leu 




50 










55 










60 










Pro 


Phe 


Gly 


Gly 


Thr 


Val 


Glu 


Val 


Glu 


Glu 


His 


Gly 


Asn 


Arg 


Pro 


XJt- CI 


65 










70 










75 










80 


Lys 


Glu 


Glu 


Phe 


Ala 


Val 


lie 


lie 


Ala 

nx d 


VJXJy 


Pro 

XT X U 


XJC u 


UXll 


nx o 


Tip 


xxp 










85 










90 










95 




Leu 


Gin 


Phe 


Ala 


Ala 


xxp 


Met 


Xj u. 


AT a 


uXU 


1 

v ax 


Q p v* 

O t. X 


v ct x 


Tip 
lie 


nio 


OXll 








100 










1 0 ^ 
X VJ «^ 










X X \J 






nx o 


Th t" 
x nx 


XT lltS 


w -L U 


T.pn 
XJt; ix 


Php 

xt lit: 


X 11X 


Php 
XT I it: 


i yr 


Han 


Leu 


Q d T~ 


T 1 p 
IXC 


Leu 


XTllt? 


V ciX 






115 










120 










125 










j_i t; Li 


lieu 


XT X 


T 1 p 
IXC 


x rp 


Prn 


Leu 


Asp 


Gly 


r: i w 
b±y 


Xj_y o 


Xj t; U. 


Xj t: u. 


Ph Q 
XTllc 


Leu 




130 










135 










14 0 










Leu 


^1 It: 


C p -v- 
OCX 


T 

Lys 


uXll 


Leu 


XT X O 


ph O 

xr lie 


Gin 


Lys 


Ala 


XI X o 




Leu 


7\ en 


Leu 


X *d .J 










1 RO 

X »J \J 










155 










1 fiO 
1DU 


Ly s 


J. I IX 


O p T* 
uCX 


T 




XTIlfci 




Leu 


Leu 


Leu 


Gly 


bys 


lrp 


V O.X 


Leu 


Ph o 










165 










170 










1 7 s 

X / *J 




V Ct-L 


Tip 

XXC 


XT X. LJ 


xjcu 


uXll 


Tip 
IXC 


Q Q V* 


fiXa 


Trp 


Val 


Leu 


rile 


vax 


Ph o 

XTiie 


Leu 


7\ 1 








1 ft 0 

X O W 










185 










1 QO 






v ciX 




JjGU 


XT lit; 


ox U 


OX U. 


iyr 


7\ v»rr 
-rlX y 


Gin Arg 


His 


Tyr 


Tip 

11c 


nx s 


Val 


Arg 






J- J? vJ 










900 










90 R 








irlie 


Leu 


Leu 


blU 


Arg 


Tyr 


Tyr 


tjJLy 


Lys 


Asn Arg 


Va-LU 


Leu 


blU 


Lys 


Leu 




210 










215 










220 










Leu 


Pro 


Leu 


Thr 


Val 


Lys 


Ala 


Glu 


Asp 


Lys 


Val 


Tyr 


His 


Val 


Met 


Ala 


225 










230 










235 










240 


Glu 


Phe 


Lys 


Arg 


Gly 


Cys 


Lys 


His 


Pro 


He 


He 


He 


Glu 


Lys 


Ser 


Gly 










245 










250 










255 




Gin 


Lys 


Leu 


Ser 


Gin 


Leu 


Asp 


Glu 


Asn 


Glu 


Val 


Leu 


His 


Ala 


Tyr 


Phe 








260 










265 










270 






Ala 


Asp 


Lys 


Arg 


Thr 


Asn 


Ser 


Ser 


Met 


Glu 


Glu 


Leu 


Leu 


Leu 


Pro 


Tyr 






275 










280 










285 
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